Skip to main content

03.03.2015 | Automobil + Motoren | Nachricht | Online-Artikel

Spracherkennung für barrierefreies Fahren

verfasst von: Christiane Brünglinghaus

2:30 Min. Lesedauer

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
print
DRUCKEN
insite
SUCHEN
loading …

EML European Media Laboratory und Mobilcenter Zawatzky haben eine Sprachsteuerung im Auto für Sekundär- und Komfortfunktionen entwickelt. Mit knappen Befehlen lassen sich Türöffner oder Scheibenwischer steuern.

Menschen mit einer körperlichen Behinderung können heute ein Auto selbstständig steuern, denn mechatronische Systeme ermöglichen das Lenken, Gasgeben oder Bremsen. Wer darüber hinaus den Blinker setzen oder die Klimaanlage einstellen will, kann auf die Sprache als Steuerungsinstrument zurückgreifen. Für diese sogenannten "Sekundärfunktionen" haben das EML European Media Laboratory und die Mobilcenter Zawatzky gemeinsam eine Sprachsteuerung entwickelt.

Seit der Markteinführung im Frühjahr 2014 seien bereits zahlreiche barrierefreie Fahrzeuge mit Sprachsteuerung verkauft worden, erläutern die Unternehmen. Inzwischen bauten beide Firmen in dieses System zusätzlich sogenannte "Komfortfunktionen" ein, die jetzt vorgestellt wurden. Damit kann der Nutzer per Sprachbefehl navigieren und das System dazu nutzen, die Wettervorhersage abzufragen oder den Anrufbeantworter im Büro oder Zuhause abzuhören.

Zusammenspiel von lokaler und serverbasierter Spracherkennung

"Die neue Kombination von Sekundär- und Komfortfunktionen zeigt aus unserer Sicht das gelungene Zusammenspiel von lokaler und serverbasierter Spracherkennung", erklärte EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. „Die Komfortfunktionen werden über eine serverbasierte Spracherkennung gesteuert, da auch Internetinhalte genutzt werden. Für die Sekundärfunktionen wird die lokale Spracherkennung genutzt, denn diese Funktionen müssen jederzeit "ansprechbar" sein.“

"Zur Erkennung der Sekundärfunktionen arbeitet die Spracherkennung mit einem kleinen Vokabular und grammatikbasiert, das heißt, es werden nur Wörter innerhalb dieses begrenzten Wortschatzes erkannt, die Erkennung ist dafür aber präziser und schneller als bei einer statistikbasierten Erkennung mit großem Vokabular", erläutert Kunzmann.

Um die Sicherheit auch aus Sicht des Fahrers zu gewährleisten, habe dieser die Möglichkeit, durch einen Tastendruck innerhalb von einer Sekunde nach der Spracherkennung die letzte Aktion abzubrechen. Für ein zuverlässiges Funktionieren der Sprachsteuerung sollen Mikrofone mit Richtcharakteristik und Geräuschreduktion sorgen.

"Die Spracherkennung für die Komfortfunktionen hingegen arbeitet mit statistischen Verfahren und nutzt wesentlich mehr Rechenleistung als der Spracherkenner im Auto. Hier werden allerdings nur Erkennungsaufgaben durchgeführt, die nicht sicherheitsrelevant sind, die aber den Fahrkomfort erhöhen", erklärt Kunzmann.

Wie die Spracherkennung funktioniert

Beide Erkennungssysteme werden von der gleichen EML-Technologie bedient. Bei der Datenverarbeitung komme es nicht darauf an, die Stimme einzelner Sprecher zu analysieren, sondern aus den Stimmen vieler Sprecher die statistischen Parameter eines akustischen Modells für qualitativ hochwertige, sprecherunabhängige Erkennungssysteme abzuleiten, so Kunzmann.

Mit diesem akustischen Modell könnten die Systeme lernen, „wie“ Menschen sprechen. "Das EML-Modell ist sprecherunabhängig, da es zum Beispiel in seiner deutschen Version auf Sprecher aus ganz Deutschland, von Schleswig bis Schwaben, von Aachen bis Zwickau aufbaut", erklärt der Forscher.

Für die erfolgreiche Umsetzung sprachlicher Kommunikation in Schrift müsse aber auch klar sein, „was“ Menschen in verschiedenen Situationen sagen. Hier sollen große Textmengen aus den jeweiligen Anwendungsbereichen helfen, zum Beispiel aktuelle Nachrichten oder Suchanfragen. "Je besser man die Spracherkennung auf die entsprechenden Anwendungen optimiert, desto höher sind die Erkennungsraten", so Kunzmann. Das EML-Sprachmodell umfasse mehr als eine Million Wörter.

print
DRUCKEN

    Premium Partner