Skip to main content
main-content

2022 | Buch

Netzbasierte Ansätze zur natürlichsprachlichen Informationsverarbeitung

share
TEILEN
insite
SUCHEN

Über dieses Buch


Für Leser, die bereits die Grundlagen der Wissensverarbeitung und Computernetzwerke beherrschen, gibt das Buch einen Überblick über innovative Verfahren, die die automatisierte Suche, Recherche, Klassifikation und Verwaltung von Texten im Kontext dezentraler Systeme und vor allem im WWW erlauben. Besondere Aufmerksamkeit wird dabei auf eine personalisierte Verarbeitung gerichtet, die auch zeitliche Aspekte, wie z. B. das digitale Vergessen, einbeziehen. An vielen Stellen werden auf interessante und neuartige Art und Weise Analogien aus anderen Wissensgebieten, so z. B. zur Verarbeitung von Informationen und zum Lernen im menschlichen Gehirn sowie der Natur schlechthin genutzt.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Das menschliche Gehirn
Zusammenfassung
Bis heute ist das menschliche Gehirn die leistungsfähigste Informationsverarbeitungs- und Kommunikationseinrichtung, die auf der Erde zurzeit zur Verfügung steht. Die Kenntnis, wie die Speicherung von Informationen, das Lernen und Wiedererkennen von Objekten und Prozessen vor sich geht, gibt die Möglichkeit, diese in Computern und anderen künstlichen Informationsverarbeitungseinheiten nachzubilden oder zumindest davon inspiriert ähnlich effektive Systeme zu schaffen.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 2. Lernen aus makroskopischer Sicht
Zusammenfassung
Die Fähigkeit zu Lernen und sich der Umgebung anzupassen stellt den wohl wesentlichsten Unterschied des Menschen zu den Tieren dar.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 3. Der kortikale, mikroskopische Lernansatz
Zusammenfassung
Erstaunlicherweise lassen sich die im letzten Kapitel an Buchstaben und Texten gemachten Beobachtungen auch auf Grafiken, Schallsignale u. a. Informationsflüsse verallgemeinern. Ein bekanntes Beispiel hierzu sind die Sprünge der Augen (Sakkaden) beim Erfassen (oder besser Abtasten) eines Gesichts (oder auch anderen Bildes), wie in Abb. 3.1 und [38] gezeigt.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 4. Netzwerke für Textuntersuchungen
Zusammenfassung
Folgt man den bisher beschriebenen Gedanken, beginnt eine Textverarbeitung zunächst bei der Erkennung von Buchstaben auf dem untersten Hierarchieniveau. Dabei kann ein Buchstabe entweder aus einer Reihe von (durch Sakkaden der Augen erkannten) Linienabschnitten zusammengesetzt werden, aus akustischen Signalen als eine bestimmte Abfolge von Schwingungen bestimmter Frequenzen oder aber auch aus den von den Fingern wahrgenommenen taktilen Informationen der Braille-Blindenschrift abgeleitet werden. Wie oft hier und in weiteren Schichten eine Sequenz präsentiert werden muss , um als gelernt zu gelten, hängt sicher von der Anzahl der möglichen Sequenzen insgesamt als auch von Parametern ab, die man vielleicht generalisiert als Intelligenz oder Lernfähigkeit bezeichnen könnte.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 5. Digitales Aktualisieren und Vergessen
Zusammenfassung
Jede Sprache ändert sich mehr oder weniger schnell über einen bestimmten Zeitraum und reflektiert dabei aktuelle Entwicklungen der Gesellschaft oder auftretende Ereignisse. Daher würde ein zu Anfang des 18. Jahrhunderts geborener Mensch nur mit Schwierigkeiten heute seine eigene Muttersprache verstehen und umgekehrt. Bestimmte, vor allem geografisch isolierte Regionen entwickeln aus diesem Grund ihren eigenen Dialekt; hierbei erfüllt die Sprache neben dem Kommunikationsaspekt auch eine weitere Aufgabe als Gruppenidentifikator bzw. zur Ausgrenzung von Nicht-Gruppenmitgliedern aus einer bestimmten Community.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 6. Dynamische Bedeutungsschwerpunkte
Zusammenfassung
In den bisherigen Kapiteln wurden i. Allg. sogenannte Bag-of-Words-Verfahren betrachtet, wobei es lediglich um die Häufigkeit des Auftretens bestimmter Wörter in einem Text ging. Diese Verfahren berücksichtigen zwei wichtige Aspekte der menschlichen Sprache nicht bzw. nicht ausreichend:
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 7. Weitere Exploration von Netzwerkstrukturen
Zusammenfassung
Im Data Mining und insbesondere im Text Mining geht man davon aus, dass sich der Verarbeitungsprozess in vier Phasen im Rahmen von Pipelines vollzieht [89]:
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 8. Konzepte der Realisierung
Zusammenfassung
In den vorangegangenen Kapiteln wurden neue Methoden zur Verarbeitung und Auswertung natürlichsprachlicher Informationen zunächst auf theoretischem Niveau erörtert.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 9. Konzepte der dynamischen Systemoptimierung
Zusammenfassung
Wie im vorherigen Kapitel gesehen, können nicht alle Probleme durch ein einzelnes Peer alleine gelöst werden. Hierzu braucht es eine Kooperation mit anderen Peers, die sich sowohl in der dirketen Nachbarschaft oder aber auch weiter entfernt befinden bzw. dem jeweiligen Peer noch gar nicht bekannt sind. Trotz vieler Indizien kann z. B. die Existenz eines Knotens/Wortes in einem über viele Peers verteilten Kookkurrenzgraphen nur durch Abfrage aller Peers sicher entschieden werden.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 10. Ansätze für ein
Zusammenfassung
Das 1989 von Tim Berners-Lee am CERN in der Schweiz ins Leben gerufene World Wide Web (WWW) stellt eine der möglichen Nutzungen des Internet dar, das auf in der Hypertext Markup Language (HTML) geschriebenen Dokumenten beruht, die auf durch das Internet verbundenen Servern abgespeichert werden.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Kapitel 11. Zusammenfassung und Zukunft
Zusammenfassung
Die Betrachtung und Nutzung von relativ großen Netzwerken und Graphen als deren Modell stand im Vordergrund des vorliegenden Buches. Die dabei betrachteten Anwendungen reichten von der Verarbeitung natürlichsprachlicher Informationen, dem Text Mining und der gezielten Suche nach Informationen, bis hin zu Aspekten der Verarbeitung in Computernetzwerken.
Herwig Unger, Mario Kubek, Panchalee Sukjit
Backmatter
Metadaten
Titel
Netzbasierte Ansätze zur natürlichsprachlichen Informationsverarbeitung
verfasst von
Herwig Unger
Mario Kubek
Panchalee Sukjit
Copyright-Jahr
2022
Electronic ISBN
978-3-658-37284-2
Print ISBN
978-3-658-37283-5
DOI
https://doi.org/10.1007/978-3-658-37284-2

Premium Partner