Der folgende Artikel ist eine Geschichte über die Entstehung und Bearbeitung einer bestechenden (Business-) Idee die bisher nicht umgesetzt wurde und nach vielen Monaten konzeptioneller Vorarbeit nun veröffentlicht wird. Warum? Einfach lesen!

Einleitung

Vor ca. zwei Jahren habe ich angefangen mich intensiv mit diesen „Web 2.0 Dingen“ zu beschäftigen. Eine meiner Lieblingsseiten zu dieser Zeit war Last.fm. Die Idee über Profilabgleiche zu passender Musik zu kommen ist einfach genial.

Im Rahmen meiner Recherchen auf hunderten verschiedener Websites (inkl. Blogs) kam mir irgendwann der Einfall, dass man doch das gleiche System für viele Arten von Informationen benötigt. Eine Art Last.fm für News. Ein System, was mir aus unendlich vielen Quellen so etwas wie ein personalisiertes Spiegel Online erstellt und dabei auf unzählige (messbare) Informationen für die Personalisierung zurückgreift.

Ein halbes Jahr später (Anfang 2007) war die Idee immer noch da und es gab keine Lösung zu sehen. Nach kurzem Anteasern einiger Freunde haben wir uns zu einem kleinen Team gefunden, um an der Umsetzung dieser Idee zu arbeiten: Das Projekt Tasterati (Taste + Technorati) war geboren.

Im Folgenden möchte ich kurz erzählen welche Probleme genau gelöst werden sollten, wie weit wir gekommen sind, was die Stolpersteine sind/waren und warum wir uns am Ende gegen eine Umsetzung entschieden haben. Eine ggf. interessante Geschichte für Freunde der technischen Innovation und Startup Welt.

Problembeschreibung

Alle Informationworker können die Idee wahrscheinlich gut nachvollziehen. In einem Umfeld exponentiell steigender Komplexität in diversen Branchen ist es zwingend notwendig möglichst viele wichtige Informationen aus dem Internet „aufzusaugen“ und für seine Bedürfnisse zu verarbeiten. Mit steigendem Output an Informationen steigt der Aufwand relevante Informationen zu finden. Man wendet sozusagen zunehmend Zeit auf, um das lauter werdende Grundrauschen „überhören“ zu können. Jeder kann sich ungefähr vorstellen, was die Anbindung von FriendFeed an Twitter bedeutet. Man möchte eigentlich nur die wirklich spannenden Themen im Longtail der Informationen für sich finden. Eine redaktionelle Sortierfunktion á la Golem oder Spiegel Online funktioniert da leider nicht mehr. Die Qualität von Informationen wird zunehmend weniger durch redaktionelle Systeme (z.B. Zeitungen) sichergestellt, als von unabhängigen Fachexperten und Nischenjournalen. Dieses Problem betrifft momentan „nur“ die Informationworker (Blogger, Trendforscher, IT-Freaks…), aber langfristig alle Nutzer. Denn auch das Grundrauschen in vornehmlich privaten Informationen muss irgendwann gefiltert werden.

Problembeschreibung
Problembeschreibung

Nachdem sich alle aus dem Team einig waren, haben wir das Projekt Tasterati systematisch vorangetrieben. Wettbewerbsanalyse, Strategie, User Interface,  Algorithmus, und vieles mehr wurde in wöchentlichen Treffen diskutiert filetiert und im WIKI dokumentiert, um gleich die nächsten Teilaufträge mitzunehmen. Auch wenn jeder nur ein paar Stunden Zeit pro Woche mit dem Thema verbracht hat, war die Lernkurve bei allen Beteiligten extrem steil und die intrinsische Motivation groß. Learning: Neben einem 50h/Woche Job ist es nicht einfach intrinsisch motiviert zu bleiben, wenn es keine regelmäßigen Erfolgserlebnisse gibt. Ok – was haben wir eigentlich im Detail herausgefunden?

Analyse

Wie sieht die Zielgruppe aus?

Wir haben uns ein bißchen gefühlt wie die Erfinder der Batterie. Nur dass es fast gar keine Elektrogeräte gab. Wer braucht den eigentlich so ein intelligentes Newssystem? Klar wir selber wären begeisterte Nutzer eines solchen Systems. Relevant wäre es für alle Personen die bereits heute schon sehr viele Informationen von vielen Quellen konsumieren. Das ist meist beruflich bedingt und sind z.B. Blogger, Strategen, Trendforscher und noch ein paar mehr. Alles in allem aber eine sehr überschaubare Zielgruppe. ABER das ist nur eine Momentaufnahme. Vor dem Hintergrund steigender Informationskomplexität in nahezu allen Branchen und zunehmenden privaten Informationsströmen (Friendfeed & Co) ist es nur eine Frage der Zeit bis sich die Zielgruppe vergrößtert. Das ist in der folgenden Abbildung illustriert:

Zielgruppen (-Wachstum)
Zielgruppen (-Wachstum)

Ich vermag aber noch nicht zu sagen, welcher Trigger so ein Bedürnis auslöst. Vielleicht das lauter werdende Grundrauschen = Unnütze Informationen, oder steigender Suchaufwand = Zeitproblematik oder vielleicht etwas ganz anderes. Dann reicht eine personalisierte Startseite á la Netvibes und Co. nicht mehr aus. Damit sind wir auch schon beim Wettbewerb.

Wie sieht der Wettbewerb aus?

Dieser Teil des Projekts war sehr anspruchsvoll. Die Herausforderung bestand/besteht darin mit dem bestehenden Wissen und Gewohnheiten und einer Idee ein sattelfestes Zukunftsszenario zu konstruieren. Wir haben uns über bestehende Systeme unserem Szenario angenähert. Aus Baukastenspielen wie ‚igoogle + personalisierung‘, ‚technorati + intelligenz‘, ’spiegel + lokalisierung‘, ‚last.fm + news‘ …. sind wir zu einer Mischung aus allen Systemen gekommen. ‚Nur‘ der Part mit der Intelligenz ist neu. Wir haben die Wettbewerbsmatrix mit den Dimensionen Personalisierungsgrad und Themenbreite beschrieben. Und wie man sieht gibt es schon ein paar andere Plattformen die sich dem von uns beschriebenen Problem grob annähern. Learning: Irgendwer hatte deine Idee bestimmt schon vorher.

Wettbewerb
Wettbewerb

Ein paar Dienste werden euch bekannt vorkommen, aber kein einziger dieser Dienste nimmt eine marktbeherrschende Position ein. Im Gegenteil – einige Dienste wurden nach kurzer Zeit wieder vom Server genommen. Die lesenswerte Story von Findory soll da nur ein Beispiel sein. Über die verwendeten Dimensionen kann man natürlich diskutieren. Feeds2.0 ist eigentlich auch nur ein Feedreader der leider nur einen halben Schritt weitergeht und irgendwie bunt webzwonullig aussehen soll. Das Bild ist ggf. auch nicht 100% vollständig und aktuell. Mein Lieblingsdienst Rivva würde sich unten links einsortieren und auch neuere Startups wie Allyve (wäre wohl wie Feeds2.0). Diese Dienste gehen aber noch nicht weit genug. Allyve wird einen Kampf gegen Windmühlen kämpfen. Ein statischer, manuell gesteuerter Informationstrichter kann mE keine Chance haben.

Eines wird bei der Betrachtung der Wettbewerber allerdings klar. Obwohl alle mit sehr guten Ideen gestartet sind, scheinen die technischen Hürden bei der Umsetzung einer Lösung im Matrixfeld rechts oben immens hoch. Mehr dazu später bei den „Hürden“. Insgesamt macht die Wettbewerbermatrix Lust auf mehr. Der Markt ist bei Eintreffen der Annahmen gigantisch und die Felle sind noch nicht verteilt. Um alles etwas plastischer darzustellen haben wir uns auch an der Konzeption eines User Interfaces versucht:

Wie könnte ein User Interface aussehen?

Diese Frage kann man wohl nie zur Zufriedenheit aller Nutzer beantworten. Wir haben deshalb einfach eine Art personalisiertes Spiegel Online nachgebaut. Wahrscheinlich muss ein solches System auch komplett anders aussehen. Der Name Newspearl ist dabei frei erfunden. Von dynamischen Kategorien bis hin zu geographischen und Personalisiserungsschiebereglern. Damit könnte man in der Stellung Personalisierung=gering einfach die Ergebnisse von DIGG nachempfinden und in der Maximumstellung bekommt man nur noch (personalisierte) hoch relevante Ergebnisse angezeigt. Das folgende Bild gibt das glaube ich ganz gut wider:

tasterati_ui
User Interface

„Ach das wäre echt eine coole Seite….

Eine solche Seite ist natürlich immer nur eine Möglichkeit die Informationen zu erhalten. Ob die Ausgabe zusätzlich auf dem Handy, im Facebook Account oder per eigenen RSS Feed erfolgt ist erst einmal egal.

Wie arbeitet das System?

Es gibt diverse Eingaben die ein solches System verarbeiten kann, um dem Nutzer relevante Newsergebnisse zu liefern. Nach ersten Brainstorming-Runden kommen wir auf 6 bis 10 relevante Eingabekanäle über die ein solches System lernen kann. Bestehende Systeme nutzen leider nur sehr wenige davon. Zum Beispiel nutzt iGoogle zu 95% manuelle Anpassungen und lässt manuelle Empfehlungen zu, bei denen das System nie intelligenter wird, weil die Masse an Informationen jederzeit statisch gespeichert wird. Tasterati sollte an mehr Stellen lernfähig sein. Angefangen vom Leseverhalten des Nuters bis hin zu Bewertungsmechanismen für die Bewertung von Newsqualität. Alle aufzuzählen wäre hier etwas zu umfangreich. Halten wir fest: Auf der Nutzerseite gibt es sehr vieles was das System verarbeiten müsste.

Aber auch das Backend hat eine Menge zu tun. Von der n zu n Beziehung zwischen Informationen bis hin zu automatisierten Textvergleichen. Um ähnliche Artikel zu finden wäre das Backend schon mit wenigen Nutzern mit extremer Datenbankarbeit beschäftigt. Das komplexe System ist einer der Gründe warum wir das Projekt nie wirklich haben starten können. Ein paar Spielereien mit Ruby bekommt man schnell hin, aber besser sein als alle anderen und bei NULL starten ist mal so nebenbei kaum zu schaffen.

Die folgenden Abbildung beschreibt wie wir uns grob eine statische Informationsarchitektur vorgestellt haben, welche die Artikelinformationen performant speichert und zudem nach allgemeiner und persönlicher Relevanz sortiert.

tasteratiuniversum_v05

Algorithmus: Es existiert ein Basisindex A, der sämtliche Artikel vorhält. Dieser Index ist unveränderbar. Auf Basis von Index A wird ein zweiter Index B erstellt, welcher die Artikel nach objektiven Kriterien (z.B. Verlinkungshäufigkeit) in eine Reihenfolge bringt. Diese am Anfang berechnete Reihenfolge von Index B ist nicht fix. Über die Bewertungen des Leseverhaltens der Nutzer sowie über manuelle Bewertungen(„Love it“ und „Bann it“) werden Artikel im Index B aufgewertet und abgewertet, also in Ihrer Reihenfolge geändert.

Zusätzlich werden jedem Artikel Tags inkl. einer Bewertung zugeordnet. Die Bewertung gibt an, wie repräsentativ die einzelnen Tags für diesen Artikel sind. Anhand der zu einem Artikel zugeordneten Tags wird später bei der Suche des Algorithmus überprüft, ob dieser Artikel relevant ist. Sollen dem Nutzer Nachrichten präsentiert werden, wird der Index B mit den Tags aus dem Nutzerprofil abgeglichen. Ab einer definierten Schnittmenge von Tags und Tagbewertung, die dem Artikel zugeordner sind und Tags + Tagbewertung, welche im Nutzerprofil stehen, wird der Artikel für den Nutzer relevant angesehen und in einen Index C kopiert. Jeder Nutzer besitzt also einen einzig für ihn gültigen Index C. Index A und Index B sind hingegen allgemein gültig – also keine Personalisierung.

Die Datenverwaltung sieht zwar relativ simple aus, bei genauerem Hinsehen offenbaren sich jedoch diverse Schwierigkeiten, die ich kurz im nächsten Abschnitt zusammenfassen möchte. Learning: Wenn dein Problem bisher noch niemand lösen konnte, dann wird es wahrscheinlich auch nicht einfach für dich.

Wo sind die Hürden?

  • Die Zielgruppe für so ein System ist zum aktuellen Zeitpunkt noch sehr klein. Auch wenn die Idee/Plattform viel Resonanz finden sollte, könnte es noch Jahre dauern eine relevante Zielgruppe zu erreichen. Der Markt im RSS-Reader Bereich ist dicht und 95% der Nutzer werden sich in absehbarer Zeit nicht zur Nutzung einen anderen Plattform bewegen lassen (Lock In Effekt).
  • Es ist vollkommen unklar wie man mit so einem System Geld verdienen soll. In der eingebundenen Präsentation weist das letzte Chart zwar auf ein paar Erlösströme hin, aber diese Skizze hat vor keinem Investor Bestand. Zu Recht! Das ehste was ich mir vorstellen könnte wäre eine Art Lizenzmodell, um eine Art intelligente Informationsverbreitung in Firmen zu gewährleisten, aber der Markt ensteht erst in ein paar Jahren.
  • Niemand, aber auch wirklich niemand braucht die 1.000 Community Plattform. Es ist unabdingbar sich an bestehende Dienste anzudocken um an brauchbar viele Nutzer zu kommen. Leider verkommt die Idee dann zu einem Feature. Kann das überhaupt von einem Startup gelöst werden, oder wird der Markt von Google, Facebook oder Microsoft aufgeräumt?
  • Es ist nicht absehbar wie sich die Contentinhaber gegenüber einem solchen System verhalten. Contentmarken (Spiegel, Bild…) verlieren damit an Wert. Der Inhalt siegt. Wer hat schon Zeit sich mit so einem riesigem Problem rumzuschlagen wenn man mal ein paar tausend Nutzer hat. Bis dahin wird es aber erst einmal geduldet.
  • Die Ansätze etablierter Informatiker aus den Startups in der Wettbewerbsmatrix gehen schon in eine ähnliche Richtung wie Tasterati. Die Leute dort sind ja auch nicht doof und werden ähnliche Konzepte verfolgen. Wenn schon ein Team aus 20 etablierten IT-Fachleuten und Millionen Investments nicht in der Lage einen funktionierenden Algorithmus zu entwickeln, wie soll man das als kleines Team schaffen? Unmöglich ist zwar nichts, aber die Wahrscheinlichkeiten erscheinen nicht allzu groß.
  • Die Grundidee ist zwar nett, aber die Komplexität des Konzeptes offenbart sich im Detail. Wenn man Szenarien entwickelt wie das System funktionieren muss steigt die Komplexität scheinbar expotentiell. Man denke nur an die Zeitkomponente eines personalisierten Newsystems und dem Aufwand Informationen nur kurz (z.B. wie Rivva) versus sehr lang (z.B. Google News) vorzuhalten.
  • Last but not Least benötigt man für dieses Projekt ein Startup Team sehr komplementäre Fähigkeiten. Die hatten wir nur bedingt vorzuweisen. Vor einem Jahr war es noch fast unmöglich interessierte Informatiker zu finden. Die Idee ist einfach sehr groß wenn man darauf schaut. Ggf. kann das Problem aus eigenem Antrieb gar nicht gelöst werden, sondern ist z.B. das Abfallprodukt aus einer neuen Datenbanktechnologie. Warten wir mal ab.
  • Dazu kommen diverse kleine andere Dinge, die jetzt aber nur langweilen…

Status Quo

Die vielen Hürden haben dazu geführt, dass Tasterati nie live gegangen ist. Im Markt ist auch kein Startup zu erkennen, dass sich dieser Entwicklung ernsthaft annehmen könnte und auch wenn man bei Google und Microsoft an diesen Problemen arbeitet, erwarte ich da in den nächsten 24 Monaten nichts weiterführendes.

Wir sind über einen kleinen Dummy, viel Denkarbeit, hunderten Seiten im Projektwiki und enorm viele Erfahrungen nicht hinaus gekommen. Das heißt aber nicht, dass die Arbeit wertlos war. Die Erfahrungen kann uns keiner nehmen und es kommen hin und wieder interessante Kontakte zustande mit denen wir unsere Idee diskutieren können. Die harten Denkabende bei Pizza und Co. haben uns zumindest zeitweise das Gefühl geben können, mit an der Spitze einer technologischen Entwicklung zu stehen. Die Gespräche spiegeln uns das auch so zurück. Ob das nun stimmt oder nicht.

Die zentrale Herausforderung bei dieser Idee ist es nicht als erster die Idee zu haben (siehe Wettbewerb), sondern einen guten Algorithmus zu entwickeln der so viele Daten effizient verarbeiten kann. Dazu benötigt man noch einen Quantensprung im Bereich Datenbanktechnologie, aber zum Glück entwickelt sich in dem Bereich etwas in Deutschland. Das beobachten wir mit großem Interesse.

Was macht man also mit einer guten Idee, etwas Vorarbeit und dem Wunsch nach mehr Austausch? Na klar – am besten bloggt man darüber und schaut was passiert. Wir hätten es auch für uns behalten können, aber es gibt noch genug Details die ich hier nicht verraten habe 😉

Die Idee fasziniert uns noch immer. Wie großartig wäre es, wenn irgendjemand irgendwo im Netz etwas postet was für wenige Personen relevant ist und gerade diese Personen bekommen es in ihren Profilen angezeigt…..? Das so etwas kommen wir ist klar! Unklar ist wann und von wem.

Ein Blick auf viele aktuelle Artikel zeigt, dass die Idee mit der Zeit sogar noch mehr an Charme gewinnt. Vielleicht ist das auch ein Teil der Antwort auf die Volksnetz Frage. Aktive/manuelle Verlinkungen werden durch automatische/intelligente ersetzt. Der Titel Google 2.0 ist ggf. etwas reißerisch, aber wenn du bis hierher gelesen hast, dann hat er sein Ziel erreicht.

Spread the Word and give get Fame

Wir sind gespannt auf Feedback, freuen uns immer auf gute Kontakte und geben hiermit die Idee Tasterati an die Community. Mal schauen was draus wird. Anbei haben wir die wichtigsten Infos noch mal auf ein paar Charts zusammengefasst. Die ursprüngliche Präsentation ist inspiriert von Guy Kawasaki „The Art of Start“, aber das ist eigentlich ziemlicher Humbug in Deutschland. Learning: Ohne Businessmodel investiert hier niemand.

[slideshare id=750401&doc=tasteratikassenzonek-1226605484702728-9&w=425]

Jetzt heißt es weiterverlinken und diskutieren. Bei Bedarf bieten wir zu dem Thema auch gerne eine Session auf dem Barcamp Hamburg an.

Neue Beiträge per E-Mail abonnieren.

Deine Anmeldung konnte nicht gespeichert werden. Bitte versuche es erneut.
Danke! Bestätige deine Anmeldung bitte in der Mail, die wir dir soeben geschickt haben.