Skip to main content
main-content

Über dieses Buch

Information-Retrieval-Methoden sind heute unverzichtbar in allen Informationssystemen, die Texte verwalten. Die grundlegenden Verfahren sind aber auch auf

Inhaltsverzeichnis

Frontmatter

The Perils of Interpreting Recall and Precision Values

Abstract
“The measurement of performance is necessary to evaluate Information Retrieval systems” [Los 91] seems to be a generally accepted opinion in the Information Retrieval (IR) community. An important factor of whether a user is able to benefit from using an IR system is the effectiveness of the retrieval method implemented in the system.
H. P. Frei, S. Meienberg, P. Schäuble

Evaluating Weighted Search Terms as Boolean Queries

Abstract
A method for automatically generating Boolean queries from weighted search terms is described. The method is intended to exploit traditional Boolean Information Retrieval Systems in a more user-friendly way. In addition, the method partitions the answer set delivered by the Boolean system into sorted subsets of information items. This, in turn, allows control of the size of an answer set by simply adjusting retrieval status value thresholds. The principal advantage of the method we present is that its computational complexity is low in comparison to many other known methods. It is shown that efficiency can be improved significantly by a query reduction method. In addition, we introduce a more sophisticated method which further enhances retrieval effectiveness through the use of maximum term frequencies.
H. P. Frei, S. Meienberg

Zur Aufwandsabschätzung bei der Entwicklung eines Indexierungswörterbuches

Zusammenfassung
Für die automatische Indexierung mit einem vorgegebenen Deskriptorensystem wird ein Wörterbuch benötigt, das möglichst viele Fachausdrücke des Anwendungsgebietes durch Relationen mit Deskriptoren verbindet. Werden die in einem solchen Indexierungswörterbuch erfaßten Relationen aus der Verarbeitung von Texten gewonnen, so ergibt sich eine Beziehung zwischen der Anzahl der Texte und der Größe und Leistungsfähigkeit des Wörterbuches. Die Beschreibung derartiger Beziehungen ist besonders vor Beginn der Entwicklung eines automatischen Indexierungssystems von großem Interesse. H. Hüther hat sich in mehreren Arbeiten mit diesem Problem beschäftigt und verschiedene Schätzverfahren theoretisch hergeleitet. Für eines der von ihm vorgeschlagenen Schätzverfahren zur Abschätzung der Größe eines Indexie-rungswörterbuches in Abhängigkeit von der Anzahl der zugrundeliegenden Texte werden im vorliegenden Beitrag die Leistungsfähigkeit und die Anwendbarkeit untersucht.
Kostas Tzeras

Entwicklung linear-iterativer und logistischer Indexierungsfunktionen

Zusammenfassung
Im Fachgebiet Datenverwaltungssysteme II des Fachbereichs Informatik an der Technischen Hochschule Darmstadt wird seit 1977 an dem Problem der automatischen Indexierung gearbeitet (siehe [Lustig 86]). Das hierbei entwickelte Indexierungssystem AIR/PH YS wird seit 1985 im Fachinformationszentrum Karlsruhe bei der Inputproduktion für die Physikdatenbank PHYS eingesetzt (siehe [Biebricher et al. 88]).
Ulrich Pfeifer

ATLAS-PfleSaurus: Ein objektorientiertes System zur Unterstützung der Thesauruspflege

Zusammenfassung
ATLAS-PfleSaurus ist ein objektorientiertes System zur Unterstützung der Erstellung und Weiterentwicklung von (Teil)-Thesauri, das insbesondere übersichtliche Darstellungen von Thesauri und den redaktionellen Charakter der Thesauruspflege berücksichtigt. Die Systementwicklung wird in partizipativem Rahmen durchgeführt.
Josef Willenborg

ATLAS/ti — ein Interpretations-Unterstützungs-System

Zusammenfassung
Der vorliegende Beitrag Stellt das Interpretations-Unterstützungs-System ATLAS/ti (ti=Textinterpretation) vor, das von Psychologen, Informatikern und Linguisten im Rahmen des interdisziplinären Forschungsprojekts ATLAS an der Technischen Universität Berlin enwickelt wird. Ausgangspunkt für die Entwicklung unseres Systems its die Erfahrung von Sozialwissenschaftleern, in den bei qualitative orientierten Untersuchungen anfallenden, großen Daten und textmengen regelrecht zu ertrinken (“Zettels (Alb-) Traum”).
Die dominierende Rolle des Computers in den Sozialwissenschaften ist immer noch die eines quantitative-hermeneutischer Ausrichtung. Systematische Auseinandersezung mit textuellem Material definiert wietere mögliche Anwendungsfelder: Akquisition von Expertenwissen aus verbalen Protokollen, vergleichende Literaturanalyse, Kommentierung juristischer Fachtexte, Analyse von Argumentationsstrukturen in Round-Table-Diskussionen.
Thomas Muhr

Elektronische Ablage und Archivierung auf der Basis eines Database Management Information Retrieval Systems: — Die Bedürfnisse — Das Angebot — Die Realität (Projekterfahrungen und -aussichten einer Schweizerischen Grossbank)

Zusammenfassung
In unserem Vortrag möchten wir Ihnen aufzeigen, welche praktischen Erfahrungen beim Schweizerischen Bankverein (SBV) im Bereich „Data Base Management Information Retrieval System“ (DBM[IR]S) gemacht wurden. Wir beziehen uns auf die bisher erfolgte konkrete Projektarbeit ohne damit einen Anspruch erheben zu wollen, dass es sich hierbei um eine repräsentative oder gar wissenschaftlich belegte Gesamtanalyse der Thematik handelt.
Hans Amstutz, Barbara Holländer-Thönssen

WIDAB — Konzeption und Pilotrealisierung eines experimentellen Information Retrieval-Systems

Kurzfassung
Die Konzeption des Informationssystems WIDAB (Wirtschaftsinformationen- und Datenbank) orientiert sich an dem Ziel, aus einer wahrhaftig unübersehbaren Menge an Wirtschaftsdaten, die bei den statistischen Ämtern und Wirtschaftsforschungsinstituten gehalten werden, Informationen werden zu lassen, die so einfach zugänglich sind wie der Inhalt einer Zeitung. Dies ist vor dem Hintergrund zu sehen, daß einerseits für viele Unternehmen die Bedeutung von Wirtschaftsinformationen aus Datenbanken stetig wächst, die derzeitigen Informationsdienste die Ansprüche der Nutzer nach Aktualität, Vollständigkeit, vor allem aber nach Problemorientiertheit, Integrationsfähigkeit sowie leichtem und kostengünstigen Zugang nur sehr unzureichend erfüllen können. Anstelle einer Retrieval-Sprache soll ein Menüsystem die Nutzer in die Lage versetzen, ihre Suchanfrage präzise zu formulieren. Es ermöglicht die Navigation in Begriffshierarchien, die nach den Sachgebieten Regionen, Branchen und Variablen getrennt sind. Ziel ist es, die Mensch-Computer-Schnittstelle so zu gestalten, daß den Nutzern thematische Zusammenhänge näher gebracht und mit dem Navigieren die Formulierung der Suchanfrage nahtlos verbunden werden kann, die ihren Ausdruck im „Ankreuzen“ für das Informationsproblem relevanter Begriffe findet. Diesem Ansatz liegt die These zugrunde, daß Benutzer die ihr Informationsproblem charakterisierenden Begriffe mit denen in den Hierarchien assoziieren können.
Zu diesem Zweck wird Sachwissen in Form dieser Begriffsrelationen in den Retrievalprozeß integriert. Diese zusätzlichen Daten warden zentral von Informationsmittlern für alle Benutzer verwaltet und diesen zur Formulierung ihrer Suchanfragen zur Verfügung gestellt. Die Nutzer recherchieren nicht direct in der Datenbank, von der sie vermuten, ihr Inhat könnte zur Reduzierung ihres Informationsproblems beitragen, sondern sie bedienen sich eines automatisierten Informationmittlers, der die Recherche für sie durchführt.
Doch die Begriffshierarchien sind nicht nur für die Steuerung des Menüsystems verantwortlich, sondern auch für die genaue Umsetzung der Suchanfrage in eine automatische Datenbank-Recherche. Deshalb ist es notwendig, den Inhalt der Datenbanken mit den Begriffshierarchien zu verbinden. Erst wenn die Verweise auf die Dokumente in die Begriffsrelationen integriert sind, kann aus der Suchanfrage eine automatische Recherche abgeleitet warden, die als Suchergebnis eine am Informationsproblem orientierte Dokumentensammlung liefert. WIDAB will diesen Zuordnungprozeß weitgehend automatisieren.
Kurt Englmeier

Wissensbasiertes, inhaltsorientiertes Retrieval statistischer Daten mit EISREVU

Zusammenfassung
Derzeit verfügbare statistische Retrievalsysteme haben eine Architektur nach dem Paradigma der traditionellen Programmierung: der lirennung von Programmen und Daten. Diese System-architektur stößt bei den Anforderungen an ein intelligentes Informationssystem an ihre system-immanenten Grenzen. Um diese zu überwinden, wird eine neue Systemarchitektur, basierend auf einem objektorientierten Datenmodell, vorgeschlagen. Diese hebt die klassische Trennung zwischen numerischen Daten und Programmen auf. Die Darstellung des Modellansatzes erfolgt dabei am Beispiel der Zeitreihenanalyse.
W. Augsburger, H. K. Rieder, J. Schwab

Forensisches Informationssystem Handschriften — Ein Beispiel für ein klassifizierendes Rechercheverfahren —

Zusammenfassung
Das forensische Informationssystem Handschriften, Kurzbezeichnung FISH, wurde für den Handscbriften-Erkennungsdienst des Bundeskriminalamtes entwickelt. Ziel des Projektes war es, die Arbeitsabläufe im Handschriften-Erkennungsdienst zu vereinheitlichen und zu rationalisieren. Insbesondere sollte die Klassifizierung von Handschriften objektiviert und eine effektive Recherche ermöglicht werden. Hierzu wurden Verfahren der Mustererkennung und des Information Retrieval eingesetzt.
M. Münzenberger

Suche in Volltextdatenbanken mit Unterstützung von Hypertext

Zusammenfassung
Die Suche nach einschlägigen Artikeln in einer Volltext- bzw. Abstract-Datenbank kann über Anfragen gesteuert werden, die eine Auswahl von Deskriptoren für das gewünschte Themengebiet enthalten. Um bezüglich der in der Datenbank verwendeten Deskriptoren und ihrer Schreibweise sicher zu gehen, werden die Deskriptoren in einem Thesaurus zusammengefaßt.
Jörg Herrmann, Dieter Meiser

Eine Hypertext-Benutzerschnittstelle für ein Juristisches Volltext Information Retrieval System

Zusammenfassung
Die vorliegende Arbeit gibt einen kurzen Überblick über das EUREKA Projekt 359, „Lokale intelligente Benutzerschnittstelle für Volltext-Retrieval-systeme (ITS 90)“. Der Projektteil Hypertextschnittstelle für juristisches Volltext Information Retrieval wird präsentiert. Dabei wir der Benutzerin die Möglichkeit angeboten, ausgehend von Rechtsvorschriftenzitaten in Gerichtsentscheidungen mittels Hypertextfunktionen in eine Rechtsvorschriftendatenbank zu verzweigen. Dadurch erhält die Benutzerin die Möglichkeit des Zugriffs auf zwei thematisch unterschiedliche Datenbasen. Mittels Hypertextfunktionen können somit die rechtlichen Grundlagen von Gerichtsentscheidungen durch direkte Betrachtung die zugrundeliegenden Rechtsvorschriften überprüft bzw. nachvollzogen werden.
Dieter Merkl, A Min Tjoa, SteFan Vieweg

HyperQuery — Ein Anfragesystem mit Graphischer Benutzeroberfläche

Zusammenfassung
Das System HyperQuery ist ein Informationssystem, das Benutzern den Zugriff auf stark vernetzte multimediale Informationen erleichtern soll. Hierzu wurde ein Hypertext- bzw. Hypermediasystem um eine Anfragekomponente erweitert, die den gezielten Einstieg in eine objektorientierte Datenbasis erleichtert. Das System soll insbesondere Gelegenheitsbenutzern ermöglichen, Reiseinformationen abzurufen. Der Benutzerschnittstelle fällt dabei eine wichtige Rolle zu. Die Implementierungen zweier unterschiedlicher graphischer Benutzeroberflächen der Anfragekomponente werden vorgestellt und diskutiert.
Jürgen Herczeg, Hubertus Hohl, Matthias Ressel
Weitere Informationen