Sentiment Analysis – Emotionen auslesen
Einführung
Werfen wir zunächst einen Blick auf das, was in den letzten 10 Jahren passiert ist. Das Internet hat riesige Mengen an Daten erzeugt. Diese Daten, darunter Text, Ton und Bilder sind in vielfältigen Formaten verfügbar.
Textdaten können überall gesammelt werden: aus den Rückmeldungen von Nutzern zu Produkten, getwitterten Statements, Social-Media-Status und -Kommentaren, Nachrichtenartikeln, E-Mails, SMS, Chatrooms, Informationen auf Webseiten, Videokanälen und vielem mehr.
Auf Twitter zum Beispiel ist die Anzahl der Tweets pro Minute seit 2013 um 58 % auf über 474.000 Tweets pro Minute im Jahr 2019 gestiegen!
von Rashed Sabra

Was ist NLP?
Überspringen wir die Buzzwords: Wenn die Daten größtenteils als natürliche menschliche Sprache vorliegen, zum Beispiel als freier Text, dann wird das Verfahren zur Sprachverarbeitung als Natural Language Processing (NLP) bezeichnet.
Sentiment Analysis ist ein Bereich von NLP
Eines der wichtigsten NLP-Felder ist die Sentiment Analysis (SA), der Prozess der Gewinnung bedeutungsvoller Muster aus Textdaten. Dazu gehören die Interpretation und Klassifizierung von Emotionen (positiv, negativ und neutral) aus den Textdaten mithilfe von Textanalyseverfahren.
Für Unternehmen im Einsatz, können Marken durch die automatische Analyse von Kundenfeedback, von Umfrageantworten bis hin zu Unterhaltungen in sozialen Medien, den Kommentaren ihrer Kunden „zuhören“ und Produkteigenschaften entsprechend anpassen.
Stimmungswerte können uns helfen, den aktuellen und historischen Kontext eines Themas zu verstehen. Mit automatisierten Analysen können wir so schnell wie nie zuvor erfassen, was das breitere Publikum über ein Ereignis, ein Produkt oder ein Konzept denkt und geeignete Maßnahmen ergreifen.
Die Informationen, die im Text gespeichert sind, ermöglichen die Berechnung eines Indikators zum Beispiel negativ, neutral oder positiv. Dieser Indikator kann als Signal für Entscheidungsträger dienen.
Parteien nutzen Ergebnisse von Sentiment Analysis regelmäßig in Wahlkämpfen.

Wann man sich mit SA beschäftigen sollte
In der kommerziellen Anwendung kann Sentiment Analysis Online-Empfehlungen sowohl für Kunden als auch für Händler bereitstellen. Einerseits können die Benutzerpräferenzen, die die Daten offenbaren, E-Commerce-Plattformen bei der Analyse ihrer Produkte und Dienstleistungen helfen. Andererseits ist es aufgrund der virtuellen Natur des Online-Shoppings nicht einfach, eine Ware umfassend und objektiv zu verstehen und herauszufinden, ob Verbraucher bereit sind, sich über die Kommentare oder Meinungen anderer Verbraucher zu informieren.
Die massive Nachfrage nach politischen Informationen kann als ein weiterer wichtiger Faktor angesehen werden, der Sentiment-Analysis-Anwendungen vorantreibt. Bei der Analyse von Tweets vor den Wahlen zum Europäischen Parlament haben Forscher über einen Zeitraum von zwei Wochen (1. bis 14. Mai 2014) mehr als 1,2 Millionen Nachrichten auf Twitter in drei Sprachen (Englisch, Deutsch und Französisch) gesammelt.

Öffentliche Sicherheit, gesellschaftspolitische Ereignisse wie der Arabische Frühling und Unruhen in London zeigen anschaulich, welche Bedeutung der Stimmungsanalyse für die öffentliche Sicherheit zukommt.
Zusammenfassend lässt sich sagen, dass Einsichten aus der Sentiment Analyses nicht nur für Verbraucher und Unternehmen an Bedeutung gewinnen, wenn Meinungen über Produkte oder Dienstleistungen gesammelt werden, sondern auch eine gewichtige Rolle für die nationale Sicherheit und die Analyse der öffentlichen Meinung spielen kann.
Im ersten Teil dieses Beitrags gehen wir näher darauf ein, was Sentiment Analysis ist, wie sie funktioniert und welche Herausforderungen mit ihr einhergehen können.
1. Formen der Sentiment Analysis
2. Mechanismen der Sentiment Analysis?
3. Herausforderungen
Legen wir los!
Formen der Sentiment Analysis
Sentiment Analysis nimmt verschiedene Formen an, beginnend mit Modellen, die sich auf die Polarität konzentrieren (positiv, negativ, neutral), bis hin zu solchen, die Gefühle und Emotionen erkennen (wütend, glücklich, traurig, …), oder sogar Modelle, die Absichten identifizieren (interessiert vs. nicht interessiert).
Einige der beliebtesten Formen der Sentiment Analysis sind:
Feinkörnige Sentiment Analysis
Wenn es auf Genauigkeit bei der Polarität ankommt, können die Polaritätskategorien erweitert werden:

Die feinkörnige Stimmungsanalyse kann für die Interpretation von 5-Sterne-Bewertungen, zum Beispiel bei einer Rezension verwendet werden:
- Sehr positiv = 5 Sterne
- Sehr negativ = 1 Stern
Eine feinkörnige SA kann präzisere Ergebnisse für ein automatisiertes System liefern, das die Bearbeitung von Kundenbeschwerden priorisiert. Außerdem können zweipolige Sätze wie: „Der Ort war wirklich ekelhaft … aber die Leute dort waren herrlich.” binäre Sentiment-Klassifikatoren verwirren, was zu falschen Klassenvorhersagen führt.
Emotionen erkennen
Die Emotionserkennung zielt darauf ab, Gefühle wie Glück, Frustration, Wut, Traurigkeit und weitere zu erkennen. Viele Emotionserkennungssysteme verwenden Lexika, Listen von Wörtern und den von ihnen vermittelten Emotionen, oder komplexe maschinelle Lernalgorithmen.
Beispiele
Ich liebe es einfach.
Dieser Film erschreckt mich zu Tode!
Einer der Nachteile der Verwendung von Lexika ist, dass Menschen ihre Gefühle auf unterschiedliche Weise ausdrücken. Einige Wörter, die typischerweise Wut ausdrücken, zum Beispiel „schlecht“ oder „töten“ („Ihr Produkt ist so schlecht, Ihr Kundensupport bringt mich um!“), können manchmal Freude ausdrücken („Das ist knallhart kalkuliert, Sie helfen immer todsicher!“).
Aspektbasierte Sentiment Analysis
Wenn Sie die Stimmung von Texten analysieren, zum Beispiel von Produktrezensionen, möchten Sie in der Regel wissen, welche Aspekte oder Merkmale die Rezensenten positiv, neutral oder negativ bewerten. Hier kann die aspektbasierte Stimmungsanalyse helfen. Ein Merkmal oder ein Aspekt ist dabei ein Attribut oder eine Komponente der Entität:
Das Essen war großartig, aber der Service war furchtbar. Die Merkmale: [Essen, Service] für die Entität: Restaurant.
Dieses Problem beinhaltet Teilprobleme wie das Identifizieren relevanter Entitäten, das Extrahieren ihrer Merkmale oder Aspekte und das Festlegen, ob eine zu jedem Aspekt oder Merkmal geäußerte Meinung positiv, negativ oder neutral ist.
Grundsätzlich müssen bei der aspektbasierten Analyse explizite Aspektausdrücke gefunden werden, bei denen es sich normalerweise um Substantive und Substantivphrasen aus dem Text einer bestimmten Domäne handelt. Diese Substantive und weitere Wortarten können mit einem Part-of-Speech-Tagger (POS) identifiziert werden.
Im zweiten Teil dieses Artikels werden wir uns die NLP-Methoden und -Algorithmen, auf denen Sentiment Analysis basiert, genauer ansehen.
Über den Autor: Rashed Sabra schließt derzeit ein Masterstudium in Big Data Systems ab und forscht im Bereich Natural Language Processing. Er hat einen Bachelor-Abschluss in Künstlicher Intelligenz. Im Jahr 2020 trat er dem L-One Team bei und arbeitet seitdem an einem Projekt zur Entwicklung einer Plattform für eine Mensch-Maschine-Schnittstelle (HRI).
Sources & Links
- Yue, L., Chen, W., Li, X., Zuo, W., Yin, M., A survey of sentiment analysis in social media algorithms, Knowledge and Information Systems, 2018.
- Al-Amrani, Y., Lazaar, M., Elkadiri, K., Sentiment Analysis using supervised classification, Association for Computing Machinery, 2017.
- MonkeyLearn, Sentiment Analysis: A Definitive Guide
- P. Rao, Fine-grained Sentiment Analysis in Python (Part 1), 2019
- S. Meena, Your Guide to Sentiment Analysis, Medium.com, 2019