Social Media Monitoring umfasst nicht nur, ob man irgendwo erwähnt wird, sondern auch ob der Kommentar positiv oder negativ ist.
Dr. Mark Cieliebak an der #smm16
Die gewaltige und laufend steigende Menge an Daten lässt sich heute kostengünstig auswerten und analysieren. Social Media Monitoring Systeme crawlen die Publikationen und speichern sie lokal ab, um sie analysieren zu können. Der Crawler muss angewiesen werden, wo er suchen soll. Das Datenmeer ist sonst zu gross. Das Ziel ist «richtige Daten» zu sammeln: Hyundai baut nicht nur Autos, allenfalls interessiert es gerade nicht, dass sie auch Gabelstapler bauen.
Texte werden analysiert auf Sentiment, Influencer Detection, Sprache, Context, etc. Damit will man Daten in Informationen konvertieren.
Mit maschinellem Lernen trainiert man das System zuerst manuell und zeigt ihm, welche Informationen z.B. positive und welche negative Komponenten enthalten. Mit der Zeit lernt das System, selbständig positive von negativen Kommentaren auseinanderzuhalten.
Menschen kommen auf ca. 80% korrekte Beurteilungen von Texten, Maschinen aktuell auf ca. 60% Trefferrate.
Besonders Tweets sind schwer zu analysieren, da sehr kurz und meist mit wenig Grammatik angereichert.
Die Topic Detection haben automatische Systeme besser im Griff: Sie finden recht genau heraus, um welche Themen es in einem Text geht.
Die maschinelle Übersetzung hat grosse Fortschritte gemacht. Google Translate ist hier sogar noch weiter als die führenden Universitäten.
Influencer Detection ist sehr schwierig. Nur den Reach von jemandem zu messen reicht nicht.
Die automatische Named Entity Recognition funktioniert hervorragend.
Text Summarization funktioniert noch überhaupt nicht: Maschinen können noch nicht selbständig zusammenfassen.