Skip to main content
Erschienen in: HMD Praxis der Wirtschaftsinformatik 5/2019

01.04.2019 | Schwerpunkt

Hybrider Ansatz zur automatisierten Themen-Klassifizierung von Produktrezensionen

verfasst von: Rene Goetz, Alexander Piazza, Freimut Bodendorf

Erschienen in: HMD Praxis der Wirtschaftsinformatik | Ausgabe 5/2019

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Im Online-Handel werden durch Interaktionen von Kunden mit den Web-Plattformen enorme Datenmengen generiert. So zählt Kundenfeedback in Form von Produktrezensionen zu den unstrukturierten Daten, für deren Verarbeitung Ansätze aus dem Gebiet der Computerlinguistik und des maschinellen Lernens benötigt werden. Als Alternative zu den klassischen Ansätzen des überwachten und unüberwachten Lernens, welche im betrieblichen Kontext und der Anwendungsdomäne der Produktrezensionen oftmals an deren Grenzen stoßen, wird in diesem Artikel ein hybrider Ansatz zur Kategorisierung von Produktrezensionen vorgestellt, der die Vorteile des maschinellen Lernens und der menschlichen Expertise vereint. Ziel dieses Artikels ist es, einen Ansatz zu präsentieren, welcher es ermöglicht, automatisiert und basierend auf den Anforderungen aus der Praxis, strukturiert Themen und darauf bezogene Aspekte aus Produktrezensionen zu extrahieren. Mithilfe von Word2Vec werden semantische Beziehung der in den Rezensionen enthaltenen Wörter trainiert. Dadurch können einzelne Wörter mit vorher definierten Themen auf deren Ähnlichkeit untersucht werden und in den Rezensionen identifiziert und extrahiert werden. Dieser Ansatz wird am Beispiel eines Datensatzes von rund fünf Millionen Produktrezensionen der Online-Plattform Amazon demonstriert und dessen Ergebnisse mit denen eines gängigen Topic Modelling Ansatzes gegenübergestellt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Weitere Produktempfehlungen anzeigen
Literatur
Zurück zum Zitat Aggarwal CC, Zhai C (2012) Mining text data. Springer, Heidelberg, Berlin, New YorkCrossRef Aggarwal CC, Zhai C (2012) Mining text data. Springer, Heidelberg, Berlin, New YorkCrossRef
Zurück zum Zitat Bird S, Ewan K, Loper E (2009) Natural language processing with python. O’Reilly, Beijing, Cambridge, Farnham, Köln, Sebastopol, Taipei, Tokyo. ISBN 978-0-596-51649-9MATH Bird S, Ewan K, Loper E (2009) Natural language processing with python. O’Reilly, Beijing, Cambridge, Farnham, Köln, Sebastopol, Taipei, Tokyo. ISBN 978-0-596-51649-9MATH
Zurück zum Zitat Davenport TH, Horváth P, Paulus P (2014) big data @ work: Chancen erkennen, Risiken verstehen. Vahlen, MünchenCrossRef Davenport TH, Horváth P, Paulus P (2014) big data @ work: Chancen erkennen, Risiken verstehen. Vahlen, MünchenCrossRef
Zurück zum Zitat Mikolov T, Sutskever I, Chen K, Corrado G, Dean J (2013) Distributed Representations of words and phrases and their compositionality. In: Proceeding NIPS’13 Proceedings of the 26th International Conference on Neural Information Processing Systems – Volume 2:3111–3119 Mikolov T, Sutskever I, Chen K, Corrado G, Dean J (2013) Distributed Representations of words and phrases and their compositionality. In: Proceeding NIPS’13 Proceedings of the 26th International Conference on Neural Information Processing Systems – Volume 2:3111–3119
Zurück zum Zitat Perkins J (2014) Python 3 text processing with NLTK 3.0 cookbook. Packt, Birmingham, Mumbai Perkins J (2014) Python 3 text processing with NLTK 3.0 cookbook. Packt, Birmingham, Mumbai
Zurück zum Zitat Vinodhini G, Srisubha L, Chandrasekaran RM (2012) Feature based opinion mining for customer reviews. Int J Innov Trends Eng 3(1–2):73–78 Vinodhini G, Srisubha L, Chandrasekaran RM (2012) Feature based opinion mining for customer reviews. Int J Innov Trends Eng 3(1–2):73–78
Zurück zum Zitat Wogenstein F, Drescher J, Reinel D, Rill S, Scheidt J (2013) Evaluation of an algorithm for aspect-based opinion mining using a lexicon-based approach. In: Proceedings of the second international workshop on issues of sentiment discovery and opinion mining, S 27–35 https://doi.org/10.1145/2502069.2502074 CrossRef Wogenstein F, Drescher J, Reinel D, Rill S, Scheidt J (2013) Evaluation of an algorithm for aspect-based opinion mining using a lexicon-based approach. In: Proceedings of the second international workshop on issues of sentiment discovery and opinion mining, S 27–35 https://​doi.​org/​10.​1145/​2502069.​2502074 CrossRef
Metadaten
Titel
Hybrider Ansatz zur automatisierten Themen-Klassifizierung von Produktrezensionen
verfasst von
Rene Goetz
Alexander Piazza
Freimut Bodendorf
Publikationsdatum
01.04.2019
Verlag
Springer Fachmedien Wiesbaden
Erschienen in
HMD Praxis der Wirtschaftsinformatik / Ausgabe 5/2019
Print ISSN: 1436-3011
Elektronische ISSN: 2198-2775
DOI
https://doi.org/10.1365/s40702-019-00521-w

Weitere Artikel der Ausgabe 5/2019

HMD Praxis der Wirtschaftsinformatik 5/2019 Zur Ausgabe