Skip to main content
Top

2012 | Book

Sprachverarbeitung und Sprachübertragung

insite
SEARCH

About this book

Dieses Standardwerk der Informationsverarbeitung beschreibt in seiner 2. grundlegend überarbeiteten und erweiterten Auflage den heutigen Stand der Sprachverarbeitung und -übertragung.

Sprache ist die wichtigste und unmittelbarste Form der Kommunikation zwischen Menschen. Will man Sprache mit technisch sinnvollem Aufwand verarbeiten bzw. übertragen, so muss man berücksichtigen, wie menschliche Sprache erzeugt und wahrgenommen wird und welche linguistischen sowie phonetischen Gesetzmäßigkeiten die Sprache aufweist. Daher findet man in dem Buch neben elektroakustischen und nachrichtentechnischen Grundlagen auch Abschnitte über Linguistik, Sprach- und Hörphysiologie, Hörpsychologie und Verfahren der Sprachqualitätsbeurteilung.

Das Buch basiert auf Vorlesungen, die der Verfasser über 30 Jahre für Studierende der Nachrichtentechnik, Informatik und Medientechnik gehalten und ständig aktualisiert hat. Neben theoretischen Grundlagen wird auch stets der Anwendungsbezug hergestellt, so dass neben Studierenden auch Entwickler von nachrichtentechnischen Systemen Nutzen aus diesem Buch ziehen können.

Table of Contents

Frontmatter
1. Grundzüge der Linguistik
Zusammenfassung
Das erste Kapitel befasst sich mit dem Sprachbegriff. Diskutiert wird, was Sprache beinhaltet und welche Bedeutung Sprache hat. Zwei wichtige Eigenschaften werden in den Vordergrund gestellt: „Sprache besteht aus Zeichen“ und „Sprache dient der Kommunikation“. Diese Eigenschaften werden näher betrachtet. Beim Zeichenbegriff gibt es drei wesentliche Komponenten: das Bezeichnete, das Bezeichnende und den Zeichenbenutzer; sie werden durch das sogenannte Semiotische Dreieck veranschaulicht. Bezüglich der Kommunikation wird der Zusammenhang zum Informationsbegriff nach C.E. Shannon hergestellt.
Klaus Fellbaum
2. Grundzüge der Schallausbreitung und Elektroakustik
Zusammenfassung
Gesprochene Sprache breitet sich in Form von Schallwellen in der Luft aus. Die dabei auftretenden akustischen Phänomene spielen für die Sprachverarbeitung eine sehr wichtige Rolle. Es sollen daher nachfolgend die entsprechenden Gesetzmäßigkeiten abgeleitet und interpretiert werden. Ausgehend von den Schallfeldgrößen wird die Entstehung von Schallwellen beschrieben und für die wichtigsten Wellenformen (ebene Welle und Kugelwelle) diskutiert. Es zeigt sich, dass in ausreichender Entfernung von einer Schallquelle, dem sogenannten Fernfeld, näherungsweise stets ebene Wellen auftreten. Schließlich geht es um die kegelförmige Schallabstrahlung mit der eine Schallverstärkung erreicht werden kann. Dieser Fall wird dann verallgemeinert auf einen beliebigen ortsabhängigen Querschnittsverlauf, dessen Abstrahlcharakteristik sich durch die Webstersche Horngleichung (Trichtergleichung) beschreiben lässt.
Klaus Fellbaum
3. Grundzüge der Phonetik und Darstellungsmöglichkeiten von Sprachsignalen
Zusammenfassung
In diesem Kapitel geht es zunächst um die Spracherzeugung beim Menschen, wobei zwischen der Anregung (durch den Kehlkopf) und der Artikulation (im Wesentlichen durch Mund- und Nasenraum) unterschieden wird. Anschließend werden die wichtigsten Laute beschrieben, wobei eine Unterteilung in Konsonanten und Vokale vorgenommen wird. Es folgt dann eine kurze Betrachtung über phonologische Aspekte; dabei werden wichtige Begriffe wie z. B. Phonem, Allophon, Morph, Silbe usw. definiert. Es wird dann gezeigt, wie nach dem Vorbild der menschlichen Spracherzeugung Modelle für eine künstliche Erzeugung von Sprache entwickelt werden können. Im zweiten Teil des Kapitels werden Darstellungsmöglichkeiten von Sprachsignalen vorgestellt, wobei Spektrogramme im Vordergrund stehen, die den Vorteil einer detaillierten und zugleich sehr anschaulichen Darstellung miteinander verbinden. Die Spektrogramme werden sowohl für Einzellaute als auch für größere sprachliche Einheiten präsentiert.
Klaus Fellbaum
4. Hörphysiologie und Psychoakustik
Zusammenfassung
Die Hörphysiologie befasst sich mit dem anatomischen Aufbau und der Funktionsweise des menschlichen Hörorgans; bei der Psychoakustik geht es um auditive Wahrnehmungsphänomene sowie um ihre qualitative und quantitative Erfassung und Beschreibung. Es wird gezeigt, dass Hörphysiologie und Psychoakustik eng miteinander zusammenhängen, und es werden wichtige hörpsychologische Beziehungen abgeleitet.
Klaus Fellbaum
5. Sprachqualitätsmessungen
Zusammenfassung
Die Sprachqualität spielt eine außerordentlich wichtige Rolle bei der Verarbeitung und Übertragung von Sprache; das gilt besonders für Sprachanwendungen bei der Festnetz- und Mobiltelefonie und bei der Sprachsynthese.
Üblicherweise verwendet man für Sprachqualitätsmessungen auditive Verfahren, d. h. solche, die auf dem subjektiven Hörempfinden von Testpersonen basieren. Das ist nahe liegend, da das Hörempfinden letztlich dafür maßgebend ist, was der Benutzer akzeptiert oder nicht.
Klaus Fellbaum
6. Sprachcodierverfahren
Zusammenfassung
In diesem Kapitel werden die wichtigsten Verfahren der digitalen Sprachverarbeitung und –übertragung diskutiert. Ausgangspunkt ist die Digitalisierung des Sprachsignals, die im Zusammenhang mit der Puls-Code-Modulation (PCM) behandelt wird. Digitale Sprachcodierverfahren lassen sich unterteilen in Verfahren der Signalformcodierung mit dem Ziel, ein gesendetes digitales Sprachsignal am Empfangsort möglichst genau wieder zu rekonstruieren, in Verfahren der parametrischen Codierung, bei denen menschliche Sprachproduktions- und Perzeptionseigenschaften ausgenutzt werden sowie in Mischformen der beiden erstgenannten Verfahren.
Klaus Fellbaum
7. Merkmalextraktion und Klassifikation
Zusammenfassung
Merkmalextraktion und Klassifikation sind außerordentlich wichtige Verarbeitungsstufen für die Sprach- und Sprechererkennung; sie spielen darüber hinaus aber auch eine ebenso bedeutende Rolle bei jeglicher Form der Mustererkennung. Während die Merkmalextraktion vor allem dazu dient, das zu analysierende Datenmaterial (hier: Sprache) auf ein Minimum zu reduzieren, um auf diese Weise Verarbeitungsaufwand zu sparen sowie die wesentlichen Merkmale heraus zu „destillieren“, besteht die Aufgabe der Klassifikation darin, den analysierten Merkmalen Bedeutungen zuzuordnen. Es werden einige der wichtigsten Merkmalextraktionsverfahren vorgestellt. Bei der Klassifikation stehen statistische Klassifikatoren (Bayes-Klassifikator, Hidden-Markov-Modelle), neuronale Netze sowie Abstandsklassifikatoren, und schliesslich die dynamische Zeitnormierung im Vordergrund.
Klaus Fellbaum
8. Spracheingabe
Zusammenfassung
Die Spracheingabe dient im Wesentlichen zwei Zielen: der Erkennung von Sprache und der Erkennung eines Sprechers. Beide Erkennungsformen basieren weitgehend auf den gleichen Prinzipien der Merkmalextraktion und Klassifikation (vgl. Kap. 7). Der Unterschied zwischen den beiden Formen kommt bereits im Namen zum Ausdruck. Die Spracherkennung versucht, eine gesprochene Äußerung zu erkennen bzw. zu verstehen, um sie dann z. B. in Text oder Steuerungskommandos umzusetzen. Die Sprechererkennung dient der Verifizierung oder Identifizierung des Sprechers. Typische Anwendungen dabei sind die telefonische Banktransaktion sowie die Identifizierung eines erpresserischen Anrufers.
Klaus Fellbaum
9. Sprachausgabe
Zusammenfassung
Wie der Name bereits ausdrückt, geht es hier um die gesprochene Ausgabe von gespeicherter Sprache, schriftlich vorliegendem Text oder anderer extern sowie intern vorhandener Information. Sehr wichtig ist die Unterscheidung, ob die auszugebende Information begrenzt ist oder inhaltlich beliebig sein kann. Im ersten Fall kann man die Sprachinformationen vorher aufzeichnen und dann wiedergeben (Sprachwiedergabe) im zweiten Fall muss die Sprache künstlich (synthetisch) zusammengesetzt werden (Sprachsynthese). Beide Formen der Sprachausgabe lassen sich nicht streng trennen; so arbeiten neuere Verfahren der Sprachsynthese mit mehr oder weniger langen Sprachsegmenten von natürlicher Sprache. Gegenstand aktueller Forschung bei der Sprachsynthese ist neben einer ständigen Verbesserung der Natürlichkeit auch die Generierung von emotionaler Sprache.
Klaus Fellbaum
10. Sprachdialogsysteme
Zusammenfassung
Der sprachliche Dialog zwischen Menschen, aber auch zwischen Mensch und Maschine ist gekennzeichnet durch einen ständigen Wechsel von Sprachein- und -ausgaben. Dabei ist die Tatsache wichtig, dass beide Kommunikationsformen auch inhaltlich in einer engen Wechselbeziehung zueinander stehen. In diesem Kapitel werden einige wichtige Dialogprinzipien sowie Dialogsysteme diskutiert. Eingegangen wird auch auf multimediale Systeme sowie auf das Wizard-of-Oz-Prinzip, bei dem Computerfunktionen von verborgen agierenden Menschen wahrgenommen werden.
Klaus Fellbaum
Backmatter
Metadata
Title
Sprachverarbeitung und Sprachübertragung
Author
Klaus Fellbaum
Copyright Year
2012
Publisher
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-31503-9
Print ISBN
978-3-642-31502-2
DOI
https://doi.org/10.1007/978-3-642-31503-9