Skip to main content

Tipp

Weitere Kapitel dieses Buchs durch Wischen aufrufen

2023 | OriginalPaper | Buchkapitel

5. Informationsextraktion aus Texten

verfasst von : Carsten Lanquillon, Sigurd Schacht

Erschienen in: Knowledge Science – Grundlagen

Verlag: Springer Fachmedien Wiesbaden

Zusammenfassung

Informationsextraktion aus Texten ist ein Teilgebiet, in dem es darum geht, Fakten und Informationen aus unstrukturierten Texten zu extrahieren. Die so gewonnenen strukturierten Informationen können anschließend als Merkmale für verschiedene weitere Lernverfahren verwendet werden. In diesem Kapitel geben wir einen Einblick in die wichtigsten Verfahren der Informationsextraktion. Wir gehen insbesondere auf die Information-Extraction-Pipeline und deren Komponenten ein und erläutern Schwierigkeiten und Lösungen bei der Bearbeitung unstrukturierter Texte für Knowledge-Science-Anwendungen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Beim Pretraining werden die Modelle mithilfe großer Datensätze generisch vortrainiert und später auf den speziellen Downstreamtask mit speziellen Daten ergänzend trainiert. (Finetuning)
 
Metadaten
Titel
Informationsextraktion aus Texten
verfasst von
Carsten Lanquillon
Sigurd Schacht
Copyright-Jahr
2023
DOI
https://doi.org/10.1007/978-3-658-41689-8_5