Skip to main content
main-content

03.03.2015 | Automobil + Motoren | Nachricht | Onlineartikel

Spracherkennung für barrierefreies Fahren

Autor:
Christiane Brünglinghaus

EML European Media Laboratory und Mobilcenter Zawatzky haben eine Sprachsteuerung im Auto für Sekundär- und Komfortfunktionen entwickelt. Mit knappen Befehlen lassen sich Türöffner oder Scheibenwischer steuern.

Menschen mit einer körperlichen Behinderung können heute ein Auto selbstständig steuern, denn mechatronische Systeme ermöglichen das Lenken, Gasgeben oder Bremsen. Wer darüber hinaus den Blinker setzen oder die Klimaanlage einstellen will, kann auf die Sprache als Steuerungsinstrument zurückgreifen. Für diese sogenannten "Sekundärfunktionen" haben das EML European Media Laboratory und die Mobilcenter Zawatzky gemeinsam eine Sprachsteuerung entwickelt.

Seit der Markteinführung im Frühjahr 2014 seien bereits zahlreiche barrierefreie Fahrzeuge mit Sprachsteuerung verkauft worden, erläutern die Unternehmen. Inzwischen bauten beide Firmen in dieses System zusätzlich sogenannte "Komfortfunktionen" ein, die jetzt vorgestellt wurden. Damit kann der Nutzer per Sprachbefehl navigieren und das System dazu nutzen, die Wettervorhersage abzufragen oder den Anrufbeantworter im Büro oder Zuhause abzuhören.

Zusammenspiel von lokaler und serverbasierter Spracherkennung

"Die neue Kombination von Sekundär- und Komfortfunktionen zeigt aus unserer Sicht das gelungene Zusammenspiel von lokaler und serverbasierter Spracherkennung", erklärte EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. „Die Komfortfunktionen werden über eine serverbasierte Spracherkennung gesteuert, da auch Internetinhalte genutzt werden. Für die Sekundärfunktionen wird die lokale Spracherkennung genutzt, denn diese Funktionen müssen jederzeit "ansprechbar" sein.“

"Zur Erkennung der Sekundärfunktionen arbeitet die Spracherkennung mit einem kleinen Vokabular und grammatikbasiert, das heißt, es werden nur Wörter innerhalb dieses begrenzten Wortschatzes erkannt, die Erkennung ist dafür aber präziser und schneller als bei einer statistikbasierten Erkennung mit großem Vokabular", erläutert Kunzmann.

Um die Sicherheit auch aus Sicht des Fahrers zu gewährleisten, habe dieser die Möglichkeit, durch einen Tastendruck innerhalb von einer Sekunde nach der Spracherkennung die letzte Aktion abzubrechen. Für ein zuverlässiges Funktionieren der Sprachsteuerung sollen Mikrofone mit Richtcharakteristik und Geräuschreduktion sorgen.

"Die Spracherkennung für die Komfortfunktionen hingegen arbeitet mit statistischen Verfahren und nutzt wesentlich mehr Rechenleistung als der Spracherkenner im Auto. Hier werden allerdings nur Erkennungsaufgaben durchgeführt, die nicht sicherheitsrelevant sind, die aber den Fahrkomfort erhöhen", erklärt Kunzmann.

Wie die Spracherkennung funktioniert

Beide Erkennungssysteme werden von der gleichen EML-Technologie bedient. Bei der Datenverarbeitung komme es nicht darauf an, die Stimme einzelner Sprecher zu analysieren, sondern aus den Stimmen vieler Sprecher die statistischen Parameter eines akustischen Modells für qualitativ hochwertige, sprecherunabhängige Erkennungssysteme abzuleiten, so Kunzmann.

Mit diesem akustischen Modell könnten die Systeme lernen, „wie“ Menschen sprechen. "Das EML-Modell ist sprecherunabhängig, da es zum Beispiel in seiner deutschen Version auf Sprecher aus ganz Deutschland, von Schleswig bis Schwaben, von Aachen bis Zwickau aufbaut", erklärt der Forscher.

Für die erfolgreiche Umsetzung sprachlicher Kommunikation in Schrift müsse aber auch klar sein, „was“ Menschen in verschiedenen Situationen sagen. Hier sollen große Textmengen aus den jeweiligen Anwendungsbereichen helfen, zum Beispiel aktuelle Nachrichten oder Suchanfragen. "Je besser man die Spracherkennung auf die entsprechenden Anwendungen optimiert, desto höher sind die Erkennungsraten", so Kunzmann. Das EML-Sprachmodell umfasse mehr als eine Million Wörter.

Premium Partner

BranchenIndex Online

Die B2B-Firmensuche für Industrie und Wirtschaft: Kostenfrei in Firmenprofilen nach Lieferanten, Herstellern, Dienstleistern und Händlern recherchieren.

Zur B2B-Firmensuche

Whitepaper

- ANZEIGE -

Und alles läuft glatt: der variable Federtilger von BorgWarner

Der variable Federtilger von BorgWarner (VSA Variable Spring Absorber) ist in der Lage, Drehschwingungen unterschiedlicher Pegel im laufenden Betrieb effizient zu absorbieren. Dadurch ermöglicht das innovative System extremes „Downspeeding“ und Zylinderabschaltung ebenso wie „Downsizing“ in einem bislang unerreichten Maß. Während es Fahrkomfort und Kraftstoffeffizienz steigert, reduziert es gleichzeitig die Emissionen, indem der VSA unabhängig von der Anzahl der Zylinder und der Motordrehzahl immer exakt den erforderlichen Absorptionsgrad sicherstellt.
Jetzt gratis downloaden!

Sonderveröffentlichung

- ANZEIGE -

Konnektivität im autonomen Fahrzeug

Neue Verbindungen für zuverlässige Datenübertragung
Ohne ultimative Konnektivität und schnelle zuverlässige Datenübertragung ist das autonome Auto nicht darstellbar. Dafür müssen die Verbindungsstellen extrem anspruchsvolle Herausforderungen meistern. Mehr dazu erfahren Sie hier!

Bildnachweise