Skip to main content

1999 | Buch

SGML und XML

Anwendungen und Perspektiven

herausgegeben von: Dr. Wiebke Möhr, Ingrid Schmidt

Verlag: Springer Berlin Heidelberg

insite
SUCHEN

Über dieses Buch

SGML und XML sind fundamentale Konzepte der heutigen und künftigen Speicherung, Verarbeitung und Verbreitung langlebiger Informationen, gerade im Hinblick auf die weltweite Vernetzung durch das Internet. Ausgehend von den technischen und ökonomischen Herausforderungen unserer Informationsgesellschaft, stellen die Autoren die wichtigen Entwicklungen dar und berichten über aktuelle Projekte mit SGML- und XML-Anwendungen in der Praxis. Das Buch wendet sich an das Management informationsverarbeitender und -produzierender Unternehmen, an die Technik-Verantwortlichen und SGML-/XML-Anwender sowie an Studierende informationsverarbeitender Fächer und der Informatik.

Inhaltsverzeichnis

Frontmatter

Standortbestimmung

Frontmatter
Future Directions in SGML/XML
Abstract
SGML is unique among information representations for its ability to preserve the abstract data content of arbitrarily complex document structures. That capability has led, over the past ten years, to the near-universal adoption of SGML for large-scale document processing. Now XML — the streamlined subset of SGML for the World Wide Web — is applying generalized markup to a vastly different class of applications, ranging from data interchange to self-describing software.
In this paper, Dr. Goldfarb, inventor of SGML and co-author of The XML Handbook (Goldfarb/Prescod 1998), explains the profound implications of this major shift in computing technology (as an InfoWorld editorial called it). He describes how the SGML family of International Standards has already been revised to accommodate these new applications, and other changes that can be expected in the near future.
Charles F. Goldfarb
Evolution and use of generic markup languages
Abstract
This article will provide:
  • a brief overview of the key concepts of generic markup languages used for structured documents;
  • an introduction to the two most prominent languages in use, SGML and XML, and their respective families of related standards; and
  • reflections on the impact of the use of these languages to structure documents in the real world.
Pamela L. Gennusa
SGML — Praxis des langen Weges
Zusammenfassung
Der Ort: Amsterdam — Konferenz-Annex eines Luxushotels in einer säkularisierten Kirche. Das Jahr: 1982. Das Thema: International Markup. Die Apostel: Charles Goldfarb, Sperling Martin (USA). Die Verheißung: SGML wird die allgemeine Basis für die Dokumentverarbeitung auf Computern. Die Gemeinde: Verlagsleute, Setzer/ Drucker und andere aus den Niederlanden, Großbritannien, Deutschland, Frankreich und den USA, unter ihnen allerdings kaum oder keine „EDV“-Spezialisten!
Manfred Krüger

Praxis — heute

Frontmatter
Innovation für Nachrichtenagenturen
Zusammenfassung
Nachrichtenagenturen sind die Großhändler der Nachricht. Ihr Geschäftszweck ist es, Nachrichten aller Art aktuell zu sammeln, zu verarbeiten und an eine Vielzahl von Kunden, vorwiegend in den Medien, zu verbreiten. Nachrichten in diesem Sinne schließen alle möglichen technischen Mediaformen wie Text, Bild, Ton, Grafik und Video mit ein, wobei die frühen „klassischen“ Formen Text und Bild sind und erst in den letzten Jahrzehnten Grafik, Audio und das Fernsehmedium hinzukamen.
Klaus Sprick
Der Einsatz von XML bei der Süddeutschen Zeitung
Zusammenfassung
Kaum zu glauben, aber Pam Anderson gilt als die „Glücksfee“ der SZonNet — zumindest sehen wir vom SZonNet-Entwicklungsteam das so. SZonNet ist die Online-Ausgabe der Süddeutschen Zeitung, die seit dem 6. Oktober 1995 anläßlich des 50jährigen Jubiläums der SZ im Internet (http://www.sueddeutschte.de) zu finden ist. Die kalifornische Strandnixe aus der amerikanischen Serie Baywatch ist das Schmuckstück unseres ersten SZonNet-Prototypen gewesen erstellt Ende ’94 auf einem NeXT-Rechner am Institut für Computerlinguistik der Ludwig Maximilian Universität in München. Zwischen Streiflicht, Aufmacher, Seite Drei und der Meinungsseite räkelte sich die schöne Blonde immer dann im Wasser, wenn man auf den Namen des Präsidenten der Bundesanstalt für Arbeit, Bernhard Jagoda, klickte: Der Hyperlink war wohl „zufällig etwas daneben geraten“, vielleicht mit ein Grund, warum diese ersten SZonNet-Seiten oft für heiter entspannte Mienen sorgten und die treibenden Kräfte innerhalb der Süddeutschen positiv für die Idee SZonNet stimmten.
Lucky Kuffer
MARTIF — ein SGML-basiertes Austauschformat für terminologische Daten
Zusammenfassung
Eine zielgerichtete und effizient ablaufende fachsprachliche Kommunikation ist ohne korrekte Terminologie nicht denkbar. Deshalb benötigen Fachleute, technische Redakteure, Dokumentare und Informationsvermittler einen Zugriff auf vorwiegend einsprachige Fachwörter mit ihren entsprechenden Definitionen und Erläuterungen. Erfolgt die fachsprachliche Kommunikation über Sprachgrenzen hinweg, müssen Übersetzer und Dolmetscher die Informationen adressatenspezifisch in die Zielsprache übertragen; Recherchen in mehrsprachigen Terminologiebeständen sind eine Voraussetzung für qualitativ hochwertige Übersetzungen. Sprachplaner, Normungsfachleute, Fachlexikographen und Terminologen unterstützen die genannten Terminologienutzer durch die Erarbeitung und Dokumentation ein- und mehrsprachiger Fachwortbestände.
Klaus-Dirk Schmitz
Eine SGML-basierte bibliographische Datenbank für Nachschlagewerke
Zusammenfassung
Literaturangaben sind ein wichtiger Bestandteil von Nachschlagewerken und Lexika. Dem Leser begegnen sie in drei Varianten:
1.
Angaben zur Primärliteratur im Text eines Lexikonartikels Das Erwähnen bedeutender Werke eines Schriftstellers oder Wissenschaftlers im laufenden Text ist insbesondere in biographischen Artikeln unverzichtbar (Kafka, Newton, Virchow). Aber auch in Sachartikeln (Literatur, Kunst, Philosophie) gibt es zahlreiche Gelegenheiten, Primärliteratur anzuführen. Weil diese Literaturangaben in den Textfluss eingebunden sind, werden sie vom Leser kaum als das wahrgenommen, was sie im Grunde sind: „harte“ bibliographische Daten.
 
2.
Angaben zur Primärliteratur im Anhang eines Lexikonartikels Die zweite Variante bietet separate Abschnitte, meist in kleinerer Schrift oder anderer Schrifttype, um sie vom eigentlichen Artikel abzuheben. Diese Anhänge enthalten Hinweise zur Primärliteratur, die man erwähnen möchte, die aber nicht im Text des Artikels untergebracht werden können oder sollen.
Ein solcher Annex kann sich wiederum in zwei Unterabschnitte gliedern: den Werkkatalog und den Ausgabenkatalog. Bölls Brot der frühen Jahre ist im Werkkatalog aufgeführt, die von B. Balzer herausgegebenen zehnbändigen Werke Heinrich Bölls stehen unter den Ausgaben.
 
3.
Angaben zu weiterführender Literatur Die dritte Form enthält, ebenfalls in einem separaten Abschnitt, Hinweise zur Sekundärliteratur: Klaus Schröters rororo-Monographie über Böll findet man hier zitiert.
 
Sascha Höning
Realisierung eines SGML-basierten Publikationsprozesses im Verlag: kritische Anmerkungen
Zusammenfassung
Viele Verlage haben inzwischen erkannt, daß die Anwendung von SGML sinnvoll ist und einige bestehende Probleme in Publikationsprozessen lösen kann. Als eine große Stärke der Nutzung von SGML gilt dabei, daß mit einem kontrollierten Datenbestand möglichst automatisch eine Vielzahl unterschiedlicher Produkte erstellt werden kann.
Marion Spengler
Eines für alle: auf der Suche nach dem universellen Redaktionssystem für Verlage
Zusammenfassung
Ein SGML-basiertes Redaktionssystem zu implementieren, bedeutet einen großen zeitlichen und finanziellen Aufwand. Um vor allem den Buch-Verlagen den Weg zur Nutzung dieser Technologie zu ebnen, stellt in der Verlagsgruppe Georg von Holtzbrinck eine Betreiberfirma ein Redaktionssystem zur Online-Nutzung zur Verfügung.
Angelika Binding
SGML für dynamische Publikationen — das Beispiel Fischer Weltalmanach
Zusammenfassung
Die Magie elektronischen Publizierens hat seit einigen Jahren die Verlagsbranche ergriffen. Die Buchmessen legen beredtes Zeugnis davon ab: Das Zauberwort heißt Multimedia, und fast jeder Verlag hat eine CD-ROM im Sortiment. Die anfängliche Faszination dieser neuen Welt weicht jedoch — immer noch viel zu häufig — rasch der Ernüchterung, spätestens dann, wenn der begeisterte Käufer die CD-ROM zu Hause benutzt. Ohne vielleicht genau sagen zu können, was er sich im Unterschied zum Buch davon erhofft hat, macht sich ein dumpfes Gefühl der Enttäuschung breit. Multimedia allein macht eben noch kein gutes Produkt. Und eine CD-ROM ist nicht dann besonders gut, wenn sie dem Layout des zugrundegelegten Printprodukts nahe kommt.
Thomas Kamps, Christoph Obermeier, Klaus Reichenberger, Ingrid Schmidt
Kundendienst-Information bei Rolls-Royce Motor Cars Ltd.
Zusammenfassung
Dieser Artikel beschreibt, wie die Rolls-Royce Motor Cars Ltd. SGML-Technologie einsetzt, um den Erstellungsprozeß von Rolls-Royce-Produktinformationen für Händler und Wartungspersonal zu unterstützen. Dabei war es das Ziel, die papierbasierte Produktinformation abzulösen, die Daten statt dessen strukturiert aufzubereiten, um sie als Teil eines elektronischen Handbuches, eines elektronischen Service-Katalogs oder anderer elektronischer Dokumenttypen anzubieten. Zu diesem Zweck hat CSC Ploenzke für Rolls-Royce in einem zweijährigen Projekt ein objektorientiertes integriertes System zur automatischen Übernahme von Alt-Daten, zur Erstellung von Neu-Daten und zur Verwaltung von SGML-Dokumenten implementiert. Die zugrundeliegende Architektur, die Module dieses Autorensystems sowie die wichtigsten Phasen des Realisierungsprojekts werden im folgenden beschrieben.
Renate Mayer, Leszek Wawrzyniak
SGML/XML als Verbindungsschicht in Entwicklungsprozessen
Zusammenfassung
In modernen Entwicklungsprozessen gewinnt das Single-Source-Prinzip zunehmend an Bedeutung. SGML/XML kann als eine Integrationsplattform verwendet werden, da es ein einheitliches Ablage-, Austausch- und Archivierungsformat bietet. Der vorliegende Beitrag beschreibt eine mehrschichtige Architektur für Dokument- und Datenablage sowie die essentielle Rolle, die SGML/XML hierin übernehmen kann. Es werden mögliche Implementierungsstrategien sowie Anforderungen an Systeme diskutiert. Ein konkretes Fallbeispiel gibt praktische Erfahrungen weiter.
Bernhard Weichel
SGML in der Entwicklungsdokumentation elektronischer Komponenten
Zusammenfassung
Die technische Dokumentation elektronischer Komponenten ist ein lange Zeit stiefmütterlich behandelter Teil des Entwicklungsprozesses von Fahrzeugen in der Automobilindustrie. Pkw der neuesten Bauart weisen eine derartige Komplexität in ihrer Elektronik auf, daß die Beherrschbarkeit der Prozesse inzwischen eng mit der Qualität der Dokumentation zusammenhängt. Dies gilt nicht nur für die detaillierte Beschreibung der technischen Komponenten, sondern auch für die sie begleitenden Entwicklungsentscheidungen.
Jörg Schiller

Praxis — morgen

Frontmatter
SGML als Grundbaustein für das betriebliche Wissensmanagement
Zusammenfassung
Ausgehend von der strategischen betriebswirtschaftlichen Zielsetzung, eine wissensbasierte Unternehmung aufzubauen, zeigt der vorliegende Beitrag die Potentiale des Einsatzes von SGML in der betrieblichen Dokumentation auf. Die sich aus der verstärkten Wissensorientierung ergebenden Anforderungen an ein strategisches Informationsmanagement fuhren zur Diskussion von Integrationspotentialen des Dokumentenstandards SGML. Der Bedarf an anwendungsorientierter, methodischer Vorgehensweise wird begründet und eine mögliche schrittweise Annäherung an das strategische Ziel am Beispiel mehrerer realisierter Projekte demonstriert.
Eric Schoop, Katrin Strobel
Semantisches Markup zur Inhaltserschließung von Agenturmeldungen
Zusammenfassung
Seit jeher gehört die inhaltliche Erschließung von Nachrichten zu den täglichen Aufgaben von Nachrichtenagenturen, Zeitungen und Magazinen, die für den internen Gebrauch in der Redaktion festhalten müssen, wann und wie über ein bestimmtes Ereignis berichtet wurde. Aber auch die Veröffentlichung eines nachrichtenerschließenden Index für den externen Gebrauch, für historische und sozialwissenschaftliche Forschungen zum Beispiel, hat eine lange, ehrwürdige Geschichte. Bis zum heutigen Tag wird etwa The Times Index einmal monatlich gedruckt oder auf Mikrofilm ausgeliefert. Er geht lückenlos bis auf das Jahr 1785 zurück, auf der Website in dürren Worten als „Available 1785 forward“ vermerkt (http://www. thomson.com/psmedia/timesin.htm). In Deutschland bietet z.B. Der Spiegel seinen Lesern jährlich einen gedruckten Index zur besseren Nutzung zurückliegender Ausgaben an, und die Frankfurter Allgemeine Zeitung bringt seit einiger Zeit die Jahresausgaben der FAZ, inhaltlich sorgfältig erschlossen (Robertson 1995), als CD-ROM auf den Markt. Auch im Internet finden sich inzwischen zahlreiche Zugangshilfen (Online-Kataloge, spezielle Suchmaschinen) zu öffentlich angebotenen Nachrichtenarchiven.
Gerhard Knorz, Wiebke Möhr
Automatische Erzeugung von semantischem Markup in Agenturmeldungen
Zusammenfassung
Neue Medienformen und Verbreitungstechnologien verändern auch das Angebots- und Aufgabenprofil von Nachrichtenanbietern. Die parallele Veröffentlichung einer Nachricht über unterschiedliche Medien oder die Wiedernutzung der einmal recherchierten und zusammengetragenen Information in unterschiedlichen Angebotsformen erfordern entsprechend aufbereitete Nachrichtenformate, aus denen sich der gewünschte Mehrwert ohne menschliches Eingreifen erzeugen läßt. Die Nachrichtenindustrie hat auf diese Herausforderungen u.a. mit der Entwicklung des News Industry Text Format (NITF) reagiert. Das NITF (IPTC-NAA 1998) ist ein SGML/XML-konformer Standard zur formalen (strukturellen) und inhaltsorientierten (semantischen) Auszeichnung von Nachrichtentexten, der unter der Federführung des IPTC (International Press and Telecommunications Council) und der NAA (Newspaper Association of America) und unter Beteiligung namhafter Nachrichtenagenturen und Zeitungen ausgearbeitet worden ist.
Lothar Rostek
Modell einer mehrschichtigen Textannotation für die computerunterstützte Textanalyse
Zusammenfassung
Die computerunterstützte Textanalyse überführt einen Text, dessen hierarchische Struktur markiert sein kann, in einen Text mit inhaltsorientierten Auszeichnungen. Diese können beispielsweise den Interpretationsrahmen oder den spezifischen Zweck der Analyse widerspiegeln oder linguistisch motiviert sein und somit die Kategorien der Morphologie, der Syntax, der Semantik oder der Diskursanalyse abdecken. Darüber hinaus können Texte aus der Nachrichtenindustrie, den Geisteswissenschaften oder den Sozialwissenschaften, um nur einige mögliche Anwendungsbereiche zu nennen, mit fachgebietsbezogenen, studienspezifischen und anderen inhaltlich motivierten Kategorien annotiert werden. Sobald mehrere Analyseaspekte auf einen Text angewendet werden, spricht man von mehrschichtiger Textannotation. Die Textanalyse befaßt sich mit drei Hauptaufgaben:
1.
der automatischen oder manuellen Auszeichnung einer Textsammlung, eines einzelnen Textes oder von Textteilen nach mindestens einem Kategorienschema;
 
2.
dem Durchsuchen oder Befragen einer Textsammlung, eines einzelnen Textes oder von Textteilen, nicht nur nach speziellen strukturellen Einheiten wie Titel, Wörter oder Wortfolgen in einem Absatz, sondern auch nach inhaltlichen Auszeichnungen;
 
3.
der Anreicherung einer bereits ausgezeichneten Textsammlung, eines einzelnen Textes oder von Textteilen mit zusätzlichen Kodierungen nach einem weiteren Kategorienschema.
 
Melina Alexa, Ingrid Schmidt
Backmatter
Metadaten
Titel
SGML und XML
herausgegeben von
Dr. Wiebke Möhr
Ingrid Schmidt
Copyright-Jahr
1999
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-46881-0
Print ISBN
978-3-540-65543-5
DOI
https://doi.org/10.1007/978-3-642-46881-0