Skip to main content
main-content

Über dieses Buch

Der Zugang zu Information ist durch das Internet erheblich verändert und erleichtert worden. Gleichzeitig gibt es seit dem Web 2.0 die Möglichkeit für alle Internet-Nutzer, selbst Inhalte beizusteuern, indem sie in Foren schreiben, oder Twitter, Xing, LinkedIn, Facebook oder andere soziale Medien nutzen und auf veröffentliche Posts z. B. durch Kommentare reagieren. Diese Fülle an Informationen und Meinungen ist ein wertvoller und in der Regel sehr großer Datenschatz, den man nur mit automatischen Verfahren sinnvoll nutzen kann.
Die automatische Analyse von Meinungsäußerungen gehört in die Anwendungsbereiche Informationsextraktion und Inhaltsanalyse sowie Text Mining. Aus Texten von Internet-Nutzern werden Informationen extrahiert und analysiert, wie sie sich zu bestimmten Themen, Produkten oder Ereignissen äußern.

Dieses Buch gibt eine systematische Einführung in Methoden der automatischen Analyse von Meinungsäußerungen und zeigt die Anwendung der beschriebenen Methoden in Programmierübungen. Der Fokus liegt dabei auf deutschsprachige Daten, also auf linguistischen Ressourcen sowie Methoden zur automatischen Analyse für die deutsche Sprache. Viele Übungsaufgaben sowie in Python implementierte Programmierbeispiele und -aufgaben machen das Buch zum optimalen Begleiter für Studium und Selbststudium.

Inhaltsverzeichnis

Frontmatter

Kapitel 1. Einleitung

Zusammenfassung
Der Zugang zu Information ist durch das Internet erheblich verändert und erleichtert worden. Gleichzeitig gibt es mit dem Web 2.0 die Möglichkeit für alle Internet-Nutzer, selbst Inhalte beizusteuern, indem sie in Foren schreiben, oder Twitter, Xing, LinkedIn, Facebook oder andere soziale Medien nutzen und auf veröffentliche Posts z. B. durch Kommentare reagieren. Diese Fülle an Informationen und Meinungen ist ein wertvoller und in der Regel sehr großer Datenschatz, den man nur mit automatischen Verfahren sinnvoll nutzen kann.
Melanie Siegel, Melpomeni Alexa

Kapitel 2. Sentiment Retrieval – Meinungsäußerungen identifizieren

Zusammenfassung
Im ersten Schritt der automatischen Analyse sollen in unstrukturierten Textdaten Meinungsäußerungen automatisch identifiziert werden. Nicht alle Textteile enthalten auch Meinungsäußerungen, bei einer Buch- oder Film-Rezension zum Beispiel wird häufig ein großer Teil des Textes das Buch oder den Film zusammenfassen, ohne ihn auch gleich zu bewerten, in Twitter gibt es viele Tweets, die nicht bewerten und in Nachrichtentexten sind nur wenige Bewertungen. Für die Erkennung und Auswertung von Meinungsäußerungen werden zunächst Textteile oder Sätze gesucht, die subjektive Äußerungen enthalten. Werden solche identifiziert, werden sie im zweiten Schritt zusammen mit den Angaben zur Quelle, zum Datum und falls veröffentlicht zum Autor in eine Struktur gebracht und gespeichert, um anschließend nach Sentiments, d. h. nach Stimmungen, Emotionen und Haltungen, analysiert zu werden.
Melanie Siegel, Melpomeni Alexa

Kapitel 3. Polarität: Dokumente klassifizieren

Zusammenfassung
Bei der Dokumentklassifikation geht es darum, für ein Dokument zu entscheiden, ob es insgesamt eine positive, negative oder neutrale Meinungsäußerung ist. Diese Klassifikation nennt man “Polarität”. Bei der GermEval Shared Task 2017 (Wojatzki et al. 2017b) war die Dokumentklassifikation die Aufgabe, an der sich alle teilnehmenden Gruppen beteiligten.
Melanie Siegel, Melpomeni Alexa

Kapitel 4. Wörter in der Sentiment-Analyse

Zusammenfassung
Wörter spielen in der Sentiment-Analyse eine große Rolle. Ein wichtiger Teil der Arbeiten ist es daher, die Abdeckung zu erweitern, also mehr bewertende Wörter zu erkennen. Der Kontext der Wörter kann dabei sehr wichtig sein. Das Kapitel beschäftigt sich mit der Gewinnung von Wörtern für Wortlisten, die in der Sentiment-Analyse genutzt werden können.
Melanie Siegel, Melpomeni Alexa

Kapitel 5. Sentiment-Analyse auf Satzebene

Zusammenfassung
Bisher haben wir uns ganze Dokumente angesehen und eine Entscheidung getroffen, ob dieses Dokument eine positive, negative oder neutrale Meinungsäußerung enthält. Diese Entscheidung beruht auf dem Vorhandensein von Sentiment-Wörtern, Negations- und Verstärkungswörtern im Text, ohne dass die syntaktische Struktur beachtet wird. Für kurze Texte wie Tweets ist das eine sinnvolle Herangehensweise. Manchmal wird man aber komplexere Texte betrachten wollen. Bewertungen von Büchern sind oft wesentlich ausführlicher und bestehen aus mehreren Sätzen. Andere Anwendungen von Sentiment-Analyse wollen z. B. die Bewertungen von politischen Ereignissen durch Politiker analysieren, indem Politikerreden analysiert werden. Ein anderes Anwendungsbeispiel ist die Analyse der Bewertungen einer Partei in Zeitungsartikeln. Dies sind komplexe Fälle, bei denen in einem Satz etwas Positives und im nächsten Satz etwas Negatives stehen kann.
Melanie Siegel, Melpomeni Alexa

Kapitel 6. Was bewertet wird: Aspekte identifizieren

Zusammenfassung
In einigen Anwendungen reicht es nicht aus zu wissen, ob ein Dokument oder ein Satz eine positive oder negative Meinungsäußerung enthält. Wenn man sich z. B. die Meinungsäußerungen zur Deutschen Bahn aus der GermEval 2017  ansieht, dann werden unterschiedliche Aspekte der Bahn bewertet, wie Pünktlichkeit, Sauberkeit, Freundlichkeit des Personals usw. Es ist gut vorstellbar, dass das Management der Bahn nicht nur wissen möchte, wie die Bahn insgesamt von ihren Kunden bewertet wird, sondern auch, welche Aspekte schon sehr gut ankommen und welche noch verbessert werden müssen.
Melanie Siegel, Melpomeni Alexa

Kapitel 7. Ironie

Zusammenfassung
Wenn man sich die Ergebnisse der Analyse der GermEval-2017-Daten genauer ansieht, stellt man fest, dass ein relevanter Teil der negativen Tweets, die mit den bisher erstellten Verfahren nicht als negativ erkannt werden, ironisch sind. Dieses Kapitel beschäftigt sich mit der Erkennung von Ironie.
Melanie Siegel, Melpomeni Alexa

Kapitel 8. Analyse politischer Trends

Zusammenfassung
Meinungsforschungsinstitute betreiben einen beträchtlichen Aufwand, um die Meinungstrends der Bevölkerung bezogen auf Politiker mit Telefon- und Straßenumfragen zu erfassen. Die Meinungsforschung scheint jedoch in einer Krise zu stecken. Wir untersuchen, ob die Sentiment-Analyse zur Meinungsforschung beitragen kann.
Melanie Siegel, Melpomeni Alexa

Kapitel 9. Opinion Spam

Zusammenfassung
Mit der Zunahme der Relevanz von Kundenmeinungen und dem Einfluss von Bewertungen auf das Kaufverhalten steigt auch die Anzahl der Manipulationsversuche. Für Bewertungsportale wie auch für die Kunden ist das ein erhebliches Problem des Vertrauensverlusts. Dieses Kapitel untersucht, wie Manipulationen automatisch erkannt werden können.
Melanie Siegel, Melpomeni Alexa

Kapitel 10. Erkennung und Klassifikation von Aggression in Meinungsäußerungen

Zusammenfassung
Mit dem Aufkommen der sozialen Netzwerke entstand eine Problematik, die sich in letzter Zeit deutlich verstärkt hat: Aggressive, hasserfüllte, beleidigende Postings, bis hin zu Bedrohungen von Politikern, Journalistinnen und anderen Menschen, die ihre Meinung äußern. Es bleibt nicht immer bei verbaler Aggression, in manchen Fällen folgten darauf Verbrechen, wie 2019 im Fall des Kasseler Regierungspräsidenten Walter Lübcke. Aggression in Meinungsäußerungen umfasst das weite Spektrum vom Gebrauch von Schimpfwörtern über Beleidigungen und Diskriminierungen bis hin zu Gewaltandrohungen.
Melanie Siegel, Melpomeni Alexa

Kapitel 11. Sentiment-Analyse im Unternehmenskontext und Softwarelösungen im Markt

Zusammenfassung
Die Sentiment-Analyse hat sich in den letzten Jahren als manifester Anwendungszweig von Natural Language Processing entwickelt. Dies wird nicht nur durch die große Anzahl an wissenschaftlichen Veröffentlichungen oder durch die Vielfalt der Softwarelösungen deutlich, die im Markt angeboten werden, sondern auch dadurch, dass es zurzeit eine Reihe von verschiedenen Anwendungsfeldern in der Wirtschaft gibt, die Sentiment-Analyse als Methode einsetzen. In diesem Kapitel geben wir einen Überblick über die Softwarelösungen im Markt für deutschsprachige Sentiment-Analyse sowie die Praxis in der Wirtschaft. Zunächst betrachten wir den Markt für Sentiment-Analyse-Tools und – Services. Anschließend stellen wir Anwendungsfelder verschiedener Industrien vor und zeigen Fragestellungen, die mithilfe von Sentiment-Analyse im Unternehmenskontext beantwortet werden.
Melanie Siegel, Melpomeni Alexa

Backmatter

Weitere Informationen

Premium Partner

    Bildnachweise