Skip to main content

2022 | OriginalPaper | Buchkapitel

2. Grundlagen des Text Mining

verfasst von : Felix Groß

Erschienen in: Text Mining im Personalmanagement

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Um ein Verständnis für Text Mining zu schaffen, führt dieses Kapitel einige grundlegende Begrifflichkeiten ein. Hierfür erfolgt zunächst eine präzise Definition des Begriffs Text Mining, an die sich eine Darstellung der Eigenschaften, des typischen Ablaufs einer Text-Mining-Analyse sowie der einzelnen Teilbereiche anschließt. Zentraler Bestandteil des Kapitels ist die Entwicklung eines Kategorisierungsansatzes für den stark interdisziplinären Bereich des Text Mining. Das Kapitel schließt mit einem Überblick zu Informationssystemen für die Durchführung von Text-Mining-Analysen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Viele Algorithmen, die dem Machine Learning zuzuordnen sind, basieren sowohl auf informationstheoretischen Überlegungen als auch auf statistischen Ansätzen, z. B. der C4.5-Klassifikationsalgorithmus für Entscheidungsbäume.
 
2
Das im Rahmen des Natural Language Processing häufig angewandte Latent Semantic Indexing (LSI) basiert beispielsweise methodisch auf einem unüberwachten maschinellen (Clustering-) Lernverfahren (Aggarwal & Zhai, 2012b, S. 81).
 
3
Jiang (2012) und Niklaus et al. (2018) beschreiben beispielsweise die Methoden, die die Informationsextraktion als eigenständige Aufgabe im Rahmen des Text Mining bereitstellt, während z. B. Hotho, Nürnberger & Paaß (2005) die Informationsextraktion als Bereich ansehen, der Techniken für Text Mining zur Verfügung stellt und darüber hinaus eine mögliche Auffassung ansprechen, nach der Informationsextraktion weitgehend deckungsgleich mit Text Mining insgesamt ist (S. 22).
 
4
Sätze werden üblicherweise als Einheiten bei einer Zusammenfassung von Texten betrachtet (z. B. Nenkova & McKeown, 2012), Wörter oder Sequenzen von Wörtern im Rahmen der Extraktion bestimmter Inhalte, beispielsweise zum Abgleich mit einer Ontologie (z. B. Paredes-Valverde et al., 2018).
 
5
Einen Überblick über Visualisierungsmöglichkeiten liefert der von Kucher und Kerren (2015) entwickelte Text Visualization Browser, der auf https://​textvis.​lnu.​se/​ zugänglich ist.
 
6
Emotionen und Kognitionen können beispielsweise auch mit Audio-, Bild- und Videodaten erfasst werden. Diese Ansätze tangieren dann insbesondere die Forschungsgebiete Affective Computing und Computer Vision.
 
7
Als Beispiele für diese Gruppe von Systemen können insbesondere führende Anbieter von Datenanalysesystemen wie IBM, SPSS, AWS und Microsoft aufgeführt werden.
 
8
Hierzu zählen beispielsweise Systeme zur Analyse von Bewerberdokumenten (BITE, rexx Systems, Text Kernel) sowie zur Analyse von Mitarbeitermeinungen (Ultimate Software Employee Voice).
 
9
Kommerzielle Erweiterungen existieren beispielsweise für das System SPSS Modeler, freie Erweiterungen für das System RapidMiner.
 
10
Als Beispiele für diese Gruppe von Systemen können Discover Text, NetOwl und Text2Data aufgeführt werden.
 
11
Hierzu können insbesondere Systeme zur Analyse von Produktrezensionen gezählt werden.
 
Metadaten
Titel
Grundlagen des Text Mining
verfasst von
Felix Groß
Copyright-Jahr
2022
DOI
https://doi.org/10.1007/978-3-658-39649-7_2