Skip to main content
main-content

Inhaltsverzeichnis

Frontmatter

0. Einleitung

Zusammenfassung
Durch die in den letzten Jahren stark erweiterten elektronischen Möglichkeiten hat auf allen Gebieten, die sich mit der Herstellung von Druckerzeugnissen befassen, eine stürmische Entwicklung eingesetzt. Textautomaten verdrängen die althergebrachten Schreibmittel des Büros und bieten ungeahnte Gestaltungsmöglichkeiten beim Erstellen von Briefen und Berichten. Elektronische Setzmaschinen beschleunigen die Herstellung von Zeitungen und Büchern. Konstruktionszeichnungen, Schaltpläne sowie hochintegrierte Schaltkreise lassen sich weitaus effektiver durch rechnergestützen Entwurf zusammen mit graphischen Darstellungsmethoden erstellen.
Wolfgang Scherl

1. Literaturübersicht zur Dokumentanalyse

Zusammenfassung
Unter Zuhilfenahme von /NA84/ sind anhand aussagekräftiger Literaturstellen die wichtigsten bekannten Verfahrensprinzipien zusammengetragen und im Hinblick auf obigen Forderungskatalog kurz diskutiert. Bei den einzelnen Zitaten handelt es sich im allgemeinen um Kombinationen mehrerer Prinzipien. Sie weisen dadurch gegenüber dem Grundverfahren verbesserte Eigenschaften auf.
Wolfgang Scherl

2. Zielsetzung der Arbeit Überblick über den eigenen Lösungsweg

Zusammenfassung
Die vorliegende Arbeit hat zum Ziel, die Layout-Struktur beliebiger Dokumente aus deren Bildmatrix herauszumessen, in symbolischer Form darzustellen und hieraus bereits erste Rückschlüsse auf logische Zusammenhänge im Dokument zu ziehen. Hierzu werden die Dokumentmuster in die drei Klassen „Text“, „Grafik“ und „Bild“ eingeteilt. Um Muster der drei Klassen auf syntaktischem Wege zu erkennen, werden die Klassen durch Startsymbole ST, SG und SB dreier attributierter, stochastischer Grammatiken GRT, GRG und GRB repräsentiert. Jedes Dokumentmuster ist somit als Satz in einer der Sprachen L(GRT), L(GRG) oder L(GRB) enthalten. Die Produktionen der Grammatiken gliedern sieh in je einen syntaktischen, einen semantischen und einen stochastischen Anteil. Für die Aufgaben der Dokumentanalyse läßt sich der syntaktische wie auch der semantische Anteil der Grammatiken für die drei genannten Klassen identisch formulieren. Hierdurch ist jedes Dokumentmuster als Satz in jeder der drei Grammatiken enthalten. Die Produktionen, welche die terminalen Sätze der Klassen „Text“, „Grafik“ und „Bild“ erzeugen, unterscheiden sich lediglich in ihrer Stochastik voneinander.
Wolfgang Scherl

3. Grundlagen

Zusammenfassung
Die Aufgabe numerischer Klassifikationsverfahren ist es, einfachen Mustern direkt einen Klassennamen zuzuordnen und durch einen Code darzustellen. Das Prinzip solcher Verfahren zeigt Bild B 3.1.1.
Wolfgang Scherl

4. Arbeitsplatz, Bildaufnahme und praktische Rahmenbedingungen

Zusammenfassung
Die in den folgenden Kapiteln beschriebenen Verfahren wurden auf einem Bildverarbeitungssystem simuliert und auf ihre Funktionsfähigkeit überprüft. Den Aufbau dieses Arbeitsplatzes zeigt Bild B 4.1. Die Halbtonbilder der Druckvorlagen wurden mit handelsüblichen Videokameras von Typ Grundig FA 70 bzw. Siemens K 30 erfaßt. Sie arbeiten entsprechend der Fernsehnorm mit 625 Zeilen. Durch Montage der Kamera an einem verstellbaren Reprostativ konnte der zu verarbeitende Dokumentausschnitt sowie der Abbildungsmaßstab beliebig verändert werden. Für die Versuche wurde eine Auflösung von 5 bis 10 Punkten/mm gewählt.
Wolfgang Scherl

5. Bildgraph und Grammatiken zur Dokumentanalyse Der syntaktische Teil der Grammatiken

Zusammenfassung
Die grundsätzlichen Erläuterungen anhand Bild B 3.2.2 haben gezeigt, daß bereits einfache Kettengrammatiken in der Lage sind, den inneren Aufbau zweidimensionaler Bildmuster wiederzugeben und in Form eines Baumes symbolisch darzustellen. Im folgenden wird nun für den gemeinsamen syntaktischen Anteil der Grammatiken GRT, GRG und GRB eine programmierte Kettengrammatik GK sowie ein Baumgrammatik GB vorgestellt. Deren terminale und nichtterminale Symbolmengen sind speziell darauf ausgerichtet, die verschiedenartigen Komponenten gewöhnlicher Druckvorlagen darzustellen. Ihre Produktionen erlauben es, die Zusammenhänge innerhalb von Dokumentkomponenten in unterschiedlichen Hierarchiestufen wiederzugeben. Während von GK nur der syntaktische Teil der Produktionen vorgestellt wird, sind von der Grammatik GB auch der semantische sowie der stochastische Anteil der Regeln aufgeführt. Hand in Hand mit den Symbolen und Regeln der Grammatiken kann eine Dokumentkomponente durch einen Strukturbaum dargestellt werden. Jeder dieser Bäume stellt einen isolierten Teilgraphen des gesamten Dokumentgraphen dar.
Wolfgang Scherl

6. Bottom-Up-Verfahren zum Berechnen der Graphkomponenten aus dem Bildsignal

Zusammenfassung
Für die praktischen Experimente wurde ein Bottom-Up-Verfahren implementiert. Es prüft die Aussage der Produktionen der Grammatik GB im Bildsignal und errechnet aus den terminalen Symbolen für jedes Dokumentmuster eine individuelle Graphkomponente. Aus Gründen der Übersichtlichkeit wird das Verfahren zur Deskriptorextraktion erst am Schluß dieses Kapitels beschrieben.
Wolfgang Scherl

7. Dokumentmodelle und Erkennungsverfahren

Zusammenfassung
Das in Kapitel 5 und 6 beschriebene Analyseverfahren parst die digitalisierte Bildinformation eines Dokumentes gemäß dem syntaktischen Anteil der Produktionen der in Kapitel 5.1 vorgestellten Grammatik GB. Als Analyseergebnis wird das Dokumentbild in einzelne, isolierte Komponenten des Dokumentgraphen umgewandelt. Die Knoten und Kanten dieser Komponenten zeigen allgemein gültige Begriffe und Beziehungen innerhalb der Dokumentmuster auf. Die Entscheidung über die Klassenzugehörigkeit der Komponenten zu den Klassen „Text“, „Grafik“ und „Bild“ wird jedoch durch den semantischen und stochastischen Anteil der Produktionen getroffen. Kapitel 7.1 faßt hierzu Kennwerte des Graphen zu den Attributvektoren \(\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\rightharpoonup}$}} {q} \) aus Gl. 5.8 zusammen. Die Wahrscheinlichkeiten PT, pG und pB werden mit ihrer Hilfe durch ein Graphenvergleichsverfahren errechnet. Über die Klassenzugehörigkeit wird durch gängige Klassifikatoren entschieden. Um die Breite des Verfahrens zu verdeutlichen, erläutert Kapitel 7.2 wie mit den gleichen Graphelementen auch völlig anders geartete Aufgaben zur Dokumentanalyse gelöst werden können.
Wolfgang Scherl

8. Zusammenfassung und Ausblick

Zusammenfassung
Die vorliegende Arbeit befaßt sich mit der Analyse gedruckter Dokumente, die sich aus beliebigen Kombinationen von Textfeldern, Grafikelementen und Bildern zusammensetzen. Für dieses umfassende Aufgabengebiet wird ein einheitlicher Lösungsweg vorgestellt. Er ermöglicht es, aus der Bildmatrix des Dokuments dessen Layout zu errechnen und in symbolischer Form darzustellen. Die Arbeit zeigt hierzu Verfahren, das Dokument in Komponenten der Klassen „Text“, „Grafik“ und „Bild“ zu zerlegen, vorgegebene Symbole anhand von Modellen im Dokument zu erkennen sowie auch den Dokumenttyp einfacher Formulare zu bestimmen. Für die Dokumentanalyse wird das Wissen um den groben Aufbau der Dokumentmuster der drei obigen Klassen durch drei attributierte, stochastische Graphgrammatiken ausgedrückt. Deren terminale und nichtterminale Symbolmengen verkörpern Begriffe und Relationen innerhalb des Dokuments. Ihre Produktionen geben die Gesetzmäßigkeiten für den inneren Aufbau der Dokumentmuster wieder.
Wolfgang Scherl

9. Literaturverzeichnis

Ohne Zusammenfassung
Wolfgang Scherl

Backmatter

Weitere Informationen