Wie stark sind die Änderungen der Suchresultate in der personalisierten Suche von Google?
Wieviele Resultate aus dem Long-Tail werden bei der personalisierten Suche dargestellt?
Wie schnell personalisiert Google, wenn man neu zu suchen beginnt?
Zusammenfassung aus einer entsprechenden Forschungsarbeit.
Google Personal Search
Vortrag von Martin Feuz, Bureau Situatif, im Rahmen des Internet Briefings Zürich. Alle Fotos von Patrick Sibenaler.
Google möchte Informationen personalisiert anbieten «to give you eactly the information you want right when you want it».
Die Herausforderung liegt darin, die Suche eines Surfers zu interpretieren: Was ist wohl gemeint, wenn nach xyz gesucht wird? Ein Begriff wie z.B. «Bank» kann für verschiedene Nutzer unterschiedliche Bedeutungen haben (Disambiguation).
Seit 2005 personalisiert Google die Suchresultate. Damals basierte die Logik auf der Suchhistory: Viele User wollten etwas wiederfinden, das sie schon einmal gesucht hatten.
2007 kam der Login dazu: Google misst nicht mehr nur die Suchresultate, sondern auch das entsprechende Klickverhalten mit einem User-Profil.
2009 wurden die Suchresultate personalisiert auch wenn man nicht eingelogged ist.
2012 Google Search Plus Your World integriert auch noch Google+
Die Erforschung der personalisierten Suche (researching psearch) durch Externe wie Bureau Situatif ist sehr aufwendig und komplex, es gibt ja schliesslich keine API hierfür.
Der Forschungsansatz musste berücksichtigen, wie viele Suchanfragen man wohl absetzen muss, bis Resultate personalisiert werden
Hypothese 1: Die personalisierte Suche ist subtil, am Anfang wird man wenig Änderungen feststellen
Blau: wie oft wurden die Suchabfragen anders formuliert (von 6000 Suchabfragen, was ca. einem Jahr intensiver Google-Nutzung entspricht)
Rot: Wie stark wurden die Resultate personalisiert
Fazit: Es wird von Anfang an personalisiert und über den Verlauf noch weiter optimiert, also nicht besonders subtil…
Hypothese 2: Je mehr Nutzerdaten zur Verfügung stehen, desto mehr long-tail Inhalte kann die Suchmaschine anbieten.
Nach den 6000 Suchabfragen war ersichtlich, dass die wenigsten Resultate aus dem Long-Tail kamen.
37% der personalisierten Resultate waren «Standardresultate», die die meisten Suchenden erhalten, 43% waren auf den ersten 10 Seiten verfügbar (Top-100 Resultate). Nur 20% der Resultate kamen aus dem Long-Tail. Dabei zeigt Google nicht mehr als 1000 Resultate, obwohl meist Millionen von Resultaten ausgewiesen werden.
Die personalisierte Suche scheint also nicht Inhalte aus dem Long-Tail zeigen zu wollen, sondern für werbetreibende Kunden eine möglichst scharfe Zielgruppe zu generieren.
Die Search-Audience wird damit dem Werbemarkt angeglichen. Der Klick-Verlust (CTR) wird minimiert, indem auch die bezahlten Anzeigen für die personalisierte Suche optimiert sind.
Hypothese 3: Die personalisierte Suche bezieht sich immer auf individuelle Nutzer
Bei Amazon benutzt man collaborative Filtering: Wer dies gekauft hat, hat auch das gekauft.
Wie verhält sich die personalisierte Suche, wenn ein User eine bestimmte Abfrage noch nie vorher abgesetzt hat?
In sieben Testsessions haben auch vorher noch nie gestellte Suchen stark personalisierte Resultate gebracht. Google nimmt also für sich in Anspruch, sofort zu verstehen, was jemand mit einer neuen Suche meint. In den Tests schienen die Personalisierungen allerdings etwas trivial: Als anonymer Nutzer erhält man schneller Wikipedia-Einträge, mit einem scharfen Nutzerprofil erhält man diese fast nicht mehr.
Methode der Mess-Analyse
Es wurden Profile von 3 Philosophen erstellt mit je 7 Büchern pro Profil.
Pro Profil wurden 6000 Suchanfragen erstellt.
Verglichen wurden 200’000 Suchresultate.
Relevanz der Personalisierung
Filter Bubble: Eli Pariser hat ein interessantes Buch geschrieben, wie sich die Filter in Facebook oder personalisierten Suchresultaten auf unsere Informationsbeschaffung auswirken. Sehen wir noch was uns wirklich interessiert? Oder sehen wir nur noch was unsere bisherigen Werte bestätigt und nichts mehr aus anderen Gebieten (kulturell, politisch, etc.)?
Man weiss nicht mehr, was man nicht mehr sieht. Es entwickelt sich eine Divergenz zwischen Online- und Real-Identity, was zu einer kulturellen Ghettoisierung führen kann.
Medienkompetenz: Studien aus den USA und UK legen nahe, dass die Suchkompetenz bei den Jungen abnimmt. Die Digital Natives können zwar schnell tippen, sie wissen aber nicht, wie man resultatorientiert sucht.
Wie überprüft man die Authentizität von Bildern oder Nachrichten, wenn einem die Referenzwelt noch etwas fehlt oder anderslautende Meinungen vom Filter entfernt werden?
Lernkurve: The Laws of Simplicity. Brauchen wir noch eine Lernkurve, wenn alles so simplifiziert wird?
Seamless Design: The most profound technologies are those that disappear. They weave themselves into the fabric of everyday life until they are indistinguishable from it.
Mark Weiser, The Computer for the 21st Century.
Wir werden künftig über Geo-Location Aktionen auf unsere Smartphones erhalten, z.B. wenn wir an einem Starbucks vorbeigehen und lange nicht mehr drin waren.
Werbung: Optimierung des Distributionsverlusts vs. Kontext. Die Online-Werbung performt fast schon zu transparent, so dass der Streuverlust offen ausgewiesen wird. Die Leistung des Media-Managers kann entsprechend gut gemessen werden.
Google Search Plus Your World: Google zeigt nicht mehr nur personalisierte Suchresultate, sondern auch noch Informationen aus dem Social Network von Google+.
Die entsprechenden Einstellungen können nach Angaben von Google auch ausgeschaltet werden, so dass eine nicht-personalisierte Suche dargestellt wird. Dies ist aus User-Sicht sehr zu begrüssen, kommt aber vermutlich daher, dass die Personalisierung durch Google+ stark abweichende Resultate bringen wird und diese oft unpassend sein könnten.
Die Forschungsresultate von Martin Feuz und seinen Co-Autoren kann hier heruntergeladen werden.
https://twitter.com/#!/WalterSchaerer/status/166952654285705217
Update: Misslungene «persönliche» personalisierte Suche
Per GetClicky Monitoring im Chrome-Browser wurde ich darauf aufmerksam, dass jemand meinen Blog-Artikel über das Clouds Restaurant im Prime Tower Zürich aufgerufen hat (roter Pfeil 1 rechts).
Als ich dieselbe Suche ausführte, zeigte mir Google zwei andere Seiten von mir, die ich über Google+ verbreitet hatte, die aber «nur» einen Link auf den Restaurantbericht aufweisen (roter Pfeil 2 links).
Die Seite, die wirklich vom Restaurant handelt und für meine Suchabfrage relevant wäre, liegt für mich auf der zweiten Resultatseite.
Da scheint die Personalisierung noch nicht wirklich zu klappen…