nach oben

Erschienen in:

2018 | OriginalPaper | Buchkapitel

Speech Recognition System Using Open-Source Speech Engine for Indian Names

verfasst von : Nitin Arun Kallole, R. Prakash

Erschienen in: Intelligent Embedded Systems

Verlag: Springer Singapore

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Abstract

Speaker independence, continuous speech and huge vocabularies create most of the greatest challenges in automatic speech recognition. This paper describes Sphinx, a library that offers the feasibility of accurate, huge vocabulary, speaker-independent, continuous speech recognition. Using speech for device control is a proven hands-free solution. There are several products that use speech input for hands-free control. They usually cater the users with US/UK accent. In this paper, a speech recognition system is developed for the application of hands-free control system to be deployed in automotive environment for Indian users. This paper demonstrates the methodology and the challenges of customizing an open-source speech recognition engine for Indian users. It is demonstrated for the application of speech-based control of smartphone, and rear-view mirror rotation. Open-source package used is Pocketsphinx for speech recognition and festival for text-to-speech and pronunciation generation. All the implementations are done on a single-board computer, i.e. raspberry pi.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Intelligent Digital Signage System Based on Gender Identification

Nächstes Kapitel Energy Estimation of Embedded Systems

Wilpon JG, Rabiner LR, Bergh A (1982) Speaker-independent isolated word recognition using a 129-word airline vocabulary. J Acoust Soc Atnrr 72(2):390–396CrossRef

Jelinek F et al (1985) A real-time, isolated-word, speech recognition system for dictation transcription. In: Proceeding of IEEE international conference acoustics speech, signal processing, Mar 1985

Rabiner LR, Wilpon JG, Soong FK (1988) High performance connected digit recognition using hidden Markov models. In: Presented at the IEEE international conference acoustics speech, signal processing, Apr 1988

Cole RA, Stem RM, Phillips MS, Brill SM, Specker P, Pilant AP (1983) Feature-based speaker independent recognition of English letters. In: Presented at the IEEE international conference acoustics speech, signal processing, Oct 1983

Ravishankar MK (2005) Efficient algorithms for speech recognition. Ph.D. thesis, Citeseer

Shim B-K, Kang K-W, Lee W-S (2010) An intelligent control of mobile robot based on voice commands. Proc lEEE 98(8):1107–IIIO

Huggins-Daines D, Kumar M, Chan A, Black AW, Ravishankar M, Rudnicky AI (2006) IEEE international conference on PocketSphinx: a free, real-time, vol 1. I. IEEE, p I

Lee K-F, Hon H-W, Reddy R (1990) IEEE “an overview of the SPHINX speech recognition system”, vol 38, no I, January 1990

Kumar A, Tewari A, Horrigan S, Kam M, Metze F, Canny J (2011) Rethinking speech recognition on mobile devices

Titel: Speech Recognition System Using Open-Source Speech Engine for Indian Names
verfasst von: Nitin Arun Kallole
R. Prakash
Verlag: Springer Singapore
Buch: Intelligent Embedded Systems
Print ISBN: 978-981-10-8574-1

Electronic ISBN: 978-981-10-8575-8

Copyright-Jahr: 2018
DOI: https://doi.org/10.1007/978-981-10-8575-8_26

Neuer Inhalt

Bildnachweise

VDI-Icon, Profil Icon, inhalt2, Springer Professional Modul/© Springer Fachmedien Wiesbaden GmbH, Nachhaltigkeitsaward Key Visual/© Cometis AG/Global ESG Monitor | Daniel Rupp | Generiert mit KI, Search Icon, Banner Hanser, Kryptowährungen/© gopixa / Getty Images / iStock, MG4 aus China auf dem Prüfstand im ADAC-Technik-Zentrum in Landsberg am Lech/© ADAC e.V., Chassis eines Elektrofahrzeugs/© chesky / stock.adobe.com, Zeitschrift Wissensmanagement Cover, PatentFit-Logo/© Springer Fachmedien Wiesbaden GmbH, Sustainibility Finance/© Robert Kneschke / stock.adobe.com / Springer Fachmedien Wiesbaden GmbH, Zukunftswerkstatt Sales Excellence 2024/© AndreyPopov / Getty Images / iStock, 2023_Antrieb/© supervisuell

Springer Professional

Abstract

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Neuer Inhalt

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.