Skip to main content

04.02.2016 | Echzeitsysteme | Schwerpunkt | Online-Artikel

Software verbessert die Dynamik von Gemurmel

verfasst von: Andreas Burkert

2 Min. Lesedauer

Aktivieren Sie unsere intelligente Suche um passende Fachinhalte oder Patente zu finden.

search-config
print
DRUCKEN
insite
SUCHEN
loading …

 

Nur lautes Gemurmel. Viele Lautsprecherdurchsagen an Bahnhöfen sind in der Regel unverständlich, auch weil es in der Umgebung laut ist. Doch künftig könnte eine Software für ein besseres Verständnis sorgen. Davon Profitieren nicht nur Bahnreisende.

Dem Unverständnis bei wollen nun Forscher der Oldenburger Projektgruppe Hör-, Sprach- und Audiotechnologie des Fraunhofer-Instituts für Digitale Medientechnologie IDMT einen Riegel vorschieben. Sie haben dazu Software ADAPT DRC entwickelt, die die Verständlichkeit von Sprache deutlich verbessert – auch bei den Stimmen von Sprechern auf Konferenzen oder Gesprächen über Mobiltelefone. Ihr Trick besteht darin, den Lärm in der Umgebung über ein Mikrofon permanent zu analysieren und die Sprache in Echtzeit daran anzupassen. Dazu erklärt der Projektleiter Dr. Jan Rennies-Hochmuth: „Dabei reicht es nicht, die Stimme über Lautsprecher oder Mobiltelefon einfach lauter zu machen, um den Lärm zu übertönen“. Derlei Techniken werden heute schon beim Autoradio eingesetzt, dadurch wird die Stimme zwar lauter, aber nicht unbedingt besser verständlich, weil bei hohen Lautstärken die Boxen an ihre Grenzen stoßen und klirren. „Sprache ist deutlich komplexer“, sagt Rennies-Hochmuth.

Empfehlung der Redaktion

2015 | OriginalPaper | Buchkapitel

Nachricht und Information

„Nachricht“ und „Information“ sind zentrale Begriffe der Informatik, die intuitiv sowie aus der Erfahrung heraus vertraut sind. Während man eine „Nachricht“ als etwas Konkretes begreifen kann, ist dies mit der darin enthaltenen Information jedoch nic

 

Zum einen kommt es darauf an, bestimmte Tonhöhen, die Frequenzen, gezielt zu verstärken. Vokale sind relativ tiefe und langgezogene Wortteile, die gut zu verstehen sind. Konsonanten wie »p«, »t« und »k« hingegen sind sehr kurz und haben höhere Frequenzen. Sie sind in lauter Umgebung in der Regel weniger gut zu verstehen, für das Sprachverständnis aber sehr wichtig. So hängt zum Beispiel vom Konsonanten ab, ob der Empfänger »Kasse« oder »Tasse« versteht. »Unsere Algorithmen sind in der Lage, bestimmte Frequenzen zu gewichten und zum richtigen Zeitpunkt genau jene zu verstärken, die durch die Umgebungsgeräusche besonders gestört werden«, ergänzt Rennies-Hochmuth.

Algorithmen verstärken leise Sprachanteile

Zum zweiten berücksichtigt die Software auch die unterschiedlich lauten Anteile des Sprachsignals. Da sich gesprochene Sprache aus lauten und leisen Teilen zusammensetzt, sprechen Fachleute von Sprachdynamik. Die Sprachverständlichkeit erhöht sich vor allem dann, wenn laute Anteile gezielt gedämpft, leise Anteile gezielt verstärkt werden. Diese Technik wird Dynamic Range Compression genannt (DRC). Das ist beispielsweise auch dann von Interesse, wenn man mit einem Mobiltelefon an einer lauten Straße telefoniert.

Die ADAPT DRC-Software ist bereits bis zur Anwendungsreife entwickelt und steht Industriepartnern zur Verfügung. Da Mobiltelefone oder Anlagen für Konferenzen heute bereits über eingebaute Mikrofone verfügen, bringen die Geräte schon die erforderliche Technologie mit, um den Umgebungslärm aufnehmen zu können. Für Lautsprecheranlagen auf Bahnhöfen oder in Flughäfen müssten zunächst zusätzliche Mikrofone installiert werden.

print
DRUCKEN

Weiterführende Themen

Die Hintergründe zu diesem Inhalt

2005 | OriginalPaper | Buchkapitel

Kategorien der Sprachanalyse

Quelle:
Die Konstruktion von Feindbildern

2011 | OriginalPaper | Buchkapitel

Monitore und Sound–Systeme

Quelle:
Technische Informatik 3

Das könnte Sie auch interessieren