Skip to main content
main-content

09.10.2013 | Naturwissenschaftlich-technische Anwendungen | Im Fokus | Onlineartikel

Computer entziffern bald alle Geheimnisse eines Satzes

Autor:
Andreas Burkert
2:30 Min. Lesedauer

Das Erkennen logischer Zusammenhänge ist für Rechner kein Problem. Doch sprachlich logische Zusammenhänge in Texten zu finden, ist bisher nahezu unmöglich. Jetzt will ein Computerlinguist ganze Sätze wie auch die Absicht des Autors erkennen können.

Das maschinelle Verarbeiten gesprochener und geschriebener Sprache steht seit den 1950er Jahren ganz oben auf der Wunschliste führender Linguistiker. Zusammen mit Experten aus der Informatik bemühen sie sich seither, entsprechende Algorithmen zu finden, um das Textverständnis zu automatisieren. Zwar hat sich die Computerlinguistik in diesem halben Jahrhundert national und international erfolgreich etabliert, schreiben die Springer-Autoren Kai-Uwe Carstensen, Susanne Jekat und Ralf Klabunde in ihrem Vorwort für „Computerlinguistik und Sprachtechnologie“. Doch trotz Hochleistungsprozessessoren ist es Rechnern bis heute nicht möglich, eine Sprache zu verstehen und sinnvolle Verknüpfungen in Texten zu finden.

Für den Saarbrücker Wissenschaftler Ivan Titov ist dies aber eine besondere Herausforderung. Gemeinsam mit Informatikern entwickelt er ein Verfahren, mit dem Rechner erlernen sollen, sprachlich logische Zusammenhänge in Texten zu finden. So könnte es künftig etwa möglich sein, einen Computer gezielt über einen Text auszufragen. Der Rechner analysiert darauf den Inhalt und gibt dem Nutzer die richtigen Antworten. Dazu befasst Titov sich damit, wie Rechner lernen können, Bedeutung und Zusammenhänge von Wörtern in Sätzen und Texten zu verstehen.

Die Absicht des Autors erkennen

Das von ihm entwickelte Modell simuliert, wie Menschen Texte verfassen. „Unsere Computer lassen wir das in umgekehrter Reihenfolge abarbeiten, um Texte zu verstehen: Die Rechner werden dabei die Bedeutung des Textes oder sogar die Absichten des Autors erkennen“, erläutert der promovierte Informatiker. Der Clou: Titov und seine Arbeitsgruppe geben dieses Modell und die darin zusammengefassten Regeln nicht vor, stattdessen definieren Millionen von Sätzen diese für sie. Diese analysieren sie in umfangreichen Text-Sammlungen wie Wikipedia mit speziellen Algorithmen auf rund 100 Computern.

Mit den erarbeiteten Ergebnissen sollen Computer auch nicht offensichtliche Beziehungen zwischen Wörtern und Sätzen erkennen. Die Rechner sollen so zum Beispiel Wörter und ihre Bedeutungen im Kontext erkennen können wie folgenden Fall zeigt: Bei den Sätzen „John hat gerade seinen Abschluss an der Saar-Uni gemacht. Er arbeitet nun für Google“ ist selbst für einen Computer klar, dass John und Saar-Uni über die Beziehung „hat Abschluss gemacht“ und John, Google über „arbeitet für“ zusammengehören.

Doch das Modell der Saarbrücker Informatiker kann auch erkennen, dass John an der Universität des Saarlandes studierte und dort sehr wahrscheinlich in der Fachrichtung Informatik. Verstehen die Computer diese Muster in der menschlichen Sprache, wollen die Wissenschaftler dieses Verfahren in einem nächsten Schritt anwenden, um sie Fragen zu kleineren Texten beantworten zu lassen oder diese automatisch zusammenzufassen.

Die Hintergründe zu diesem Inhalt

Bildnachweise