2006 | OriginalPaper | Buchkapitel
Grenzen der inhaltsbasierten Kategorisierung von Hypertextstrukturen
Erschienen in: Strukturelle Analyse Web-basierter Dokument
Verlag: DUV
Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.
Wählen Sie Textabschnitte aus um mit Künstlicher Intelligenz passenden Patente zu finden. powered by
Markieren Sie Textabschnitte, um KI-gestützt weitere passende Inhalte zu finden. powered by
Obwohl sich die vorliegende Arbeit auf die struktur- und graphbasierte Analyse hypertextueller Dokumente konzentriert, wurden umfangreiche Teilarbeiten auch zur inhaltsbasierten Kategorisierung durchgeführt. Insbesondere erhält man dadurch ein besseres Verst↭dnis für die Abgrenzung, sowie für die Möglichkeiten und Grenzen der beiden Teilbereiche. Im klassischen Sinne ist der wissenschaftliche Beitrag dieses Kapitels daher auch ein „Negativergebnis“. Wie im Verlauf des Kapitels klar wird, wurden dazu sowohl mathematisch-theoretische Arbeit en als auch softwaretechnische Entwicklungen und darauf aufbauende Experimente durchgeführt. Ausgehend von einer Motivation der Problemstellung in Kapitel (3.1) wird in Kapitel (3.2) die web-basierte Extraktion und die Konstruktion des verwendeten Testkorpus T
C
detailliert dargestellt. Da das eigentliche Kategorisierungsexperiment auf der Basis eines maschinellen Lernverfahrens durchgeführt wurde, erfolgt dessen Motivation in Kapitel (3.3). In Kapitel (3.4) wird das Experiment mathematisch-theoretisch charakterisiert. Mit der Interpretation der Evaluierungsergebnisse und einem Fazit schliefit dieses Kapitel ab.