Skip to main content

2023 | Buch

Texte als Daten

Dynamische Analyse textueller Daten im Unternehmenskontext

insite
SUCHEN

Über dieses Buch

In diesem Buch werden Texte als Datengrundlage für Analysen in drei empirischen Studien untersucht. Die erste Studie fokussiert auf die Heterogenität von Produktbewertungen und identifiziert fünf dynamische Archetypen für Konsumgüterbewertungen durch die Analyse von über 23 Millionen Bewertungen auf der Webseite eines Onlineversandhändlers. Die zweite Studie betrachtet Verbrauchervorschläge als wichtige Quelle für die Produktentwicklung und zeigt die Wirksamkeit eines kategorieunabhängigen Modells zur Extraktion von Vorschlägen aus Produktrezensionen sowie die positive Wirkung von Unternehmensanreizen durch kostenlose Produkte. In der dritten Studie wird ein Index für energiepolitische Unsicherheit basierend auf Textdaten aus deutschen Zeitungen und Plenarprotokollen des Deutschen Bundestags entwickelt und sowohl qualitativ als auch extern validiert. Die Arbeit zeigt die Bedeutung von Textdaten für verschiedene Anwendungsbereiche und leistet einen Beitrag zur Verbesserung der Analysemethoden in den untersuchten Feldern.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Einleitung
Zusammenfassung
Das erste Kapitel zeigt die Relevanz von Textdaten für die empirische Marketingforschung auf. Der Schlüssel, um die große Menge an Texten effizient und effektiv zu analysieren, stellt dabei die automatisierte Textanalyse und insbesondere die Computerlinguistik dar, die in dieser Promotion im Mittelpunkt steht. Anschließend wird ein Überblick über den Aufbau der Arbeit gegeben. Dabei stellen drei empirische Forschungsarbeiten den Kern der Dissertation dar. Abschließend wird kurz die Koautorenschaft der verschiedenen Forschungsarbeiten zusammengefasst.
Ingo Lange
Kapitel 2. Texte als Daten in der Literatur
Zusammenfassung
Im Kapitel zwei der Dissertation werden die konzeptionellen Grundelemente der Forschungsarbeit beleuchtet. Es wird herausgestellt, dass sich textliche Daten sowohl durch ihre Diversität in Inhalt und Form, als auch durch die Vielzahl an Autoren und Lesern unterscheiden. Daher wird zunächst eine Systematisierung von Textdaten vorgenommen. Danach werden die für die Dissertation relevanten Textsorten genauer analysiert. Hierbei werden wesentliche Definitionen erläutert und ein Überblick über entscheidende Arbeiten in der Literatur präsentiert. Auch werden zentrale Forschungsfragen hinsichtlich der speziellen Textform zusammengefasst und die Bedeutung der Textsorte hervorgehoben. Anschließend werden die methodischen Werkzeuge im Bereich NLP vorgestellt. Zudem werden die neuesten Fortschritte in diesem Bereich kurz erläutert.
Ingo Lange
Kapitel 3. Meinungslebenszyklen: Die Dynamik von Online-Produktbewertungen
Zusammenfassung
Produktbewertungen sind in Bereichen wie der Entwicklung neuer Produkte, der Absatzprognose oder der Aktienkursentwicklung von großer Bedeutung. Um planen zu können, müssen Manager nicht nur die aktuellen Bewertungen kennen, sondern auch die zukünftigen Entwicklungen. Das Kapitel zeigt, dass es selbst mit Hilfe von Modellen des maschinellen Lernens schwierig ist, künftige Bewertungen vorherzusagen, da die Bewertungsdynamik je nach Produkt sehr unterschiedlich ist. Da die Heterogenität der Bewertungsentwicklung im Laufe der Zeit in der Literatur nicht gut widergespiegelt wird, liegt der Schwerpunkt der Forschungsarbeit dieses Kapitels darauf. Mittels Zeitreihenclustering auf Basis von Dynamic Time Warping werden 23,7 Millionen Bewertungen von Amazon.com analysiert. Daraus lassen sich fünf charakteristische Muster für Konsumgüterbewertungen ableiten. Diese Meinungslebenszyklen weisen nicht nur eine spezifische Merkmalsdynamik, sondern auch relevante Veränderungen im Zeitverlauf auf. Mit weiteren dynamischen Analysen wird gezeigt, dass sich die dynamischen Treiber auch zwischen den Clustern unterscheiden.
Ingo Lange
Kapitel 4. Vorschläge zur Produktentwicklung und -verbesserung in Produktbewertungen
Zusammenfassung
Das Kapitel untersucht den Einsatz von Natural Language Processing für die Analyse von Online-Bewertungen, die als wertvolles Feedbackinstrument für Unternehmen fungieren. Dabei wird sich auf die Verallgemeinerbarkeit der Modellierung konzentriert, die in der Literatur bisher kaum untersucht wurde. Es wird gezeigt, wie man ein kategorienunabhängiges Modell trainiert, um Vorschläge in Produktrezensionen von Verbrauchern zu erkennen. Der Verallgemeinerungsfehler wird mit Hilfe eines Leave-One-Category-Out-Ansatzes auf der Grundlage von 10.000 Sätzen von Rezensionen aus zehn High-Involvement- und zehn Low-Involvement-Kategorien bestimmt. Es zeigt sich, dass das kategorienunabhängige Modell mit einem F1-Score von 0,83 fast genauso gut abschneidet wie ein speziell trainiertes Modell. Dabei sind Transformer-Modelle den klassischen Deep-Learning-Modellen deutlich überlegen. Sie erzielen selbst bei einer sehr geringen Datenmenge sehr gute Ergebnisse. Es werden weitere Empfehlungen für die Datenvorbereitung gegeben, wie z. B. stratifiziertes Sampling, um eine hohe Leistung für ein agnostisches Modell zu erreichen.
Ingo Lange
Kapitel 5. Index für energiepolitische Unsicherheit auf der Grundlage von öffentlichen Textdaten
Zusammenfassung
Die energiepolitische Unsicherheit ist ein wichtiger Parameter für Wirtschaftsmodelle und kann nicht direkt beobachtet werden. Daher ist es sehr schwierig diese Unsicherheit zu quantifizieren. In diesem Kapitel wird gezeigt, wie man einen Index für Politikunsicherheit entwickelt, wobei der Fokus auf dem Teilbereich Energie liegt. Die Datenbasis für den Index der energiepolitischen Unsicherheit (EPU) sind öffentliche Textdaten, bestehend aus Artikeln aus neun deutschen Zeitungen und Plenarprotokollen des Deutschen Bundestages von 2000 bis 2020. Der endgültige EPU-Index wird als normalisierte Häufigkeit relevanter Dokumente über die Zeit abgeleitet. Die verwendeten Methoden der natürlichen Sprachverarbeitung für die Identifizierung relevanter Texte sind bestehenden Schlüsselwortansätzen dabei weit überlegen. Ein Vergleich mit historischen Ereignissen validiert den entwickelten Index. Der Vergleich mit anderen Indizes, wie dem Index für wirtschaftspolitische Unsicherheit von Baker, Bloom und Davis (2016), zeigt, dass hier ein neues Phänomen gemessen wird. Außerdem wird gezeigt, dass der EPU-Index eine Vorhersagekraft für Strommarkt-Futures und somit den Energiemarkt hat.
Ingo Lange
Kapitel 6. Schlussbetrachtung
Zusammenfassung
Das letzte Kapitel fasst abschließend die zentralen Erkenntnisse und den Beitrag dieser Promotionsarbeit zusammen. Dabei werden die Forschungsfragen aus dem zweiten Kapitel noch einmal aufgegriffen. Jede Forschungsfrage wird basierend auf den drei empirischen Forschungsarbeiten einzeln beantwortet und eingeordnet. Darüber hinaus wird ein Ausblick für weitere Forschung bei der Nutzung von Text als Datenquelle gegeben.
Ingo Lange
Backmatter
Metadaten
Titel
Texte als Daten
verfasst von
Ingo Lange
Copyright-Jahr
2023
Electronic ISBN
978-3-658-42973-7
Print ISBN
978-3-658-42972-0
DOI
https://doi.org/10.1007/978-3-658-42973-7

Premium Partner