Eine kurze Einleitung zum Thema „Sentiment“

Liebt Ihr Kunde Sie oder liebt er Sie nicht?

Haben Sie schon mal ins Netz gehorcht, wie „die Stimmung ist“?

Und? Wie ist Sie? Eigentlich ganz gut? Sind Sie sich sicher?

Mittlerweile gibt es zahlreiche Tools, die Stimmungen erfassen, um zu wissen, wie die Community denkt. Wer solche Daten nicht nutzt, wer nicht zuhört, der handelt schon fast grob fahrlässig. So machen es uns die Werbeversprechen dieser zahlreichen Toolanbieter jedenfalls glauben… Falsch? Nein! Auch ich persönlich bin absolut dafür, zuzuhören. Trotz aller Gegenwehr und allem Kleinreden und vielleicht erschüttert es Sie, aber: sowohl das Internet als auch das Web 2.0, das Mitmach-Web, das Social Web – wie auch immer Sie es nennen möchten – haben sich durchgesetzt. Von ganz allein produzieren Menschen Content im Web. Auch Ihre Kunden. „Geredet“ wird immer und überall – ob Sie zuhören oder nicht. Kunden wenden sich nicht mehr zwangsläufig an Sie, wenn sie ein Problem mit Ihrem Produkt haben oder auch nicht: denn die Community hört immer zu. Und die Konkurrenz womöglich auch. Sie verpassen etwas, wenn Sie es noch nicht tun. Da bin ich mir sicher.

„Alles hören können“ heißt nicht „alles wissen“

Warum das Geplänkel vorweg obwohl es hier um Sentiment Analysis gehen sollte? Weil ich im Folgenden keinesfalls den Eindruck erwecken möchte, dass „Stimmungen erfassen“ nicht wichtig wäre. Ganz im Gegenteil. Ich möchte Sie dafür sensibilisieren, zuzuhören, aber richtig. Denn „alles hören können“ heißt nicht „alles wissen“.

Ich selber beschäftige mich mit dem Thema der automatischen Erfassung und Analyse von Web-Texten seit knapp sechs Jahren. Vor allem forschungsorientiert.[1] Seit etwa einem Jahr auch beruflich. Und wenn ich nun immer mehr den Praxis-Hype um Stimmungsanalysen mitbekomme, dann bin ich ganz froh darum, zuerst die anderen Seite, die nicht dunkle Seite, der Macht kennengelernt zu haben. Warum? Haben Sie schon mal Ihre Frau sagen hören, „Nein, Schatz, das ist kein Problem“ und als Sie einige Bier und Schnaps später von der Kneipentour mit Ihren Kollegen zurückkamen, war bereits die Couch für Sie hergerichtet und die Schlafzimmertür demonstrativ verschlossen? Oder, ich will die Damenwelt nicht ausschließen, hat Ihnen eine Freundin schon mal gesagt, sie sei nicht sauer, wenn Sie ohne Sie mit der neuen Kollegin ins Kino gingen, aber beim nächsten Film hat sie fallen lassen, ob Sie nicht viel lieber mit Ihrer Kollegin ins Kino gehen würden? Und da sind wir dann schon mitten drin: „gesagt“ ist nicht unbedingt gleich „gemeint“ und „gecrawlt“ noch lange nicht „verstanden“.

Sentiment in der Forschung

In der wissenschaftlichen Forschung sind mittlerweile weit über 7000 Artikel zur automatischen Analyse von Texten entstanden [2]. Und doch gibt es noch immer wesentliche Hürden, die kaum zu überwinden sind. Sarkasmus, wie oben beschrieben, ist nur eine davon. Aber warum ist das so und was kann man dagegen tun? Nun. Die natürliche Sprache ist kompliziert. Komplizierter als ein Binärcode. Nicht alles lässt sich eindeutig als „0“ oder „1“ identifizieren. Ein Programm aber, das natürliche Texte aus dem Web zieht – ein Crawler – kann nur mit 0-1-Informationen umgehen. Er tut nur das, was Sie ihm sagen. Angenommen, Sie sind Hersteller einer bekannten Taschentuchmarke und sagen einem Crawler, er soll alle Dokumente finden, in denen über „Tempo“ gesprochen wird. Als Ergebnis werden Sie sowohl von Taschentüchern als auch von Autos lesen. Ein Crawler identifiziert Zeichenfolgen. Keinen Inhalt. Er versteht nicht. Er arbeitet ab. Sagen Sie ihm, er soll „Tempo“ und „gut“ finden, damit Sie positive Web-Beiträge finden, werden Sie zu 50% ebenfalls nicht das gewünschte Ergebnis erhalten. Nicht nur, dass Sie auch von Autos lesen. Bei genauerem Hinschauen werden Sie auch noch bemerken, dass sowohl die Beiträge „Na toll, ab jetzt ist auf der A2 durchgehend bei Tempo 120 Schluss – jetzt muss ich jeden Morgen 10Minuten früher losfahren“ als auch „Ich finde es toll, dass auf der A2 nun bei Tempo 120 Schluss ist. Endlich keine Raser mehr, die die Sicherheit gefährden.“ als positiv einstufen. Denn wie funktioniert – ganz grob – die automatische Erkennung von Stimmungen? Über Adjektive. Adjektive, die in der Nähe der gesuchten Zeichenkette stehen. „Toll“ ist im Allgemeinen positiv konnotiert. Kann aber eben genauso auch sarkastisch gemeint sein und ist dann alle andere als positiv. Ich könnte Ihnen noch zahlreiche andere Beispiele nennen, in denen ein Crawler allein Ihnen nicht weiterhelfen wird. Am Ende brauchen Sie immer auch menschliche Intelligenz. Und das ist es, was ich Ihnen hier mit auf den Weg geben möchte. Glauben Sie nicht einfach, sondern verstehen Sie. Verstehen Sie, dass Sarkasmus etwas Menschliches ist und vom Menschen identifiziert werden muss. Verstehen Sie, dass Sie einem Computerprogramm beibringen müssen, was es können soll: Synonyme, Zusammenhänge, Schreibweisen, ja sogar Rechtschreibfehler. Wer nach „Zucker“ sucht, wird nicht nur das süße Produkt finden. Er wird auch Treffer zu Damen erhalten, die als „zuckersüß“ bezeichnet werden oder Treffer zur Stadt Hamburg, in der „etwas ist Zucker“ gleichbedeutend ist mit „das ist ganz toll“. Und wie oft hat man sich schon vertippt, wenn man nur schnell eine Bewertung für ein Hotelzimmer abgeben wollte, und schrieb, „super Pesonal“ statt „super Personal“ oder Ähnliches?

Fazit

Ist nun alles Humbug, was von Social Media Listening, Social Media Monitoring oder Social Media Analytics-Tool angepriesen wird? Auf keinen Fall! Es ist nur wie mit jedem Programm: es ist nur so schlau wie sein Anwender. Und als Anwender können Sie zwar nicht alle, aber doch einige Probleme der Sentiment Analysis umgehen, indem Sie das Programm intelligent verwenden. Setzen Sie nicht einfach blind ein Tool ein. Wählen Sie mit Bedacht aus. Und definieren Sie intelligente Queries. Wie? Fragen Sie die Experten und lassen sich unterstützen. Da sind Sie hier in diesem Forum genau richtig. Meine Kollegen und ich freuen uns auf Sie! Denn ja: ich liebe es und wir lieben es! Alles, was im Web passiert. Und wir lieben es, es zu verstehen!

 [1]   Mehr dazu in: „Analyse von Konsumentenurteilen und Identifikation von Präferenzen mit Hilfe des World Wide Web – Ein konzeptioneller Rahmen zur Auswertung nutzergenerierter Inhalte“ von Diana Schindler. Voraussichtliches Erscheinen: September 2015.

[2]  Feldman, R. (2013). Techniques and Applications for Sentiment Analysis. Communications of the ACM, 56 (4), S. 82-89.

One thought on “Sentiment Analysis in der Praxis – Ich liebe es!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.