Skip to main content
main-content

Tipp

Weitere Artikel dieser Ausgabe durch Wischen aufrufen

01.06.2015 | Ausgabe 2/2015

International Journal of Speech Technology 2/2015

Minimum data generation for Telugu speech recognition

Zeitschrift:
International Journal of Speech Technology > Ausgabe 2/2015
Autoren:
K. V. N. Sunitha, A. Sharada

Abstract

A morphologically rich language has hundreds of forms of each word which makes storing and maintaining them time and resource consuming. It also leads to confusions while recognizing speech which leads to more word error rate. These issues make it difficult to build applications of speech recognition for such languages. Hence there is a need to develop a phonetically balanced minimal data set. This paper describes generating minimum dataset for Telugu language, the second most widely spoken language in India. Considering minimum data generation as a set covering problem, a variety of datasets are generated based on different criteria. From various set covering algorithms, Greedy algorithm is chosen. The criterion used for final data selection is the frequency of occurrence of words. As set covering requires a large set of data from which minimum data is selected, a 15 Million word text corpus has been created. Thorough analysis of this text corpus is carried out in order to ensure that the generated set is phonetically balanced. The generated minimum dataset consists of 21 words and covers each phoneme of the Telugu language. Telugu speech technology researchers can benefit from this data set in building applications of phoneme level speech recognition by reducing manual recording effort and time. This paper discusses the role of minimum data set in LVSR systems, details of the text corpus created and proposed algorithm for minimum data generation.

Bitte loggen Sie sich ein, um Zugang zu diesem Inhalt zu erhalten

Sie möchten Zugang zu diesem Inhalt erhalten? Dann informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 69.000 Bücher
  • über 500 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Umwelt
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Testen Sie jetzt 30 Tage kostenlos.

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 50.000 Bücher
  • über 380 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Umwelt
  • Maschinenbau + Werkstoffe




Testen Sie jetzt 30 Tage kostenlos.

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 58.000 Bücher
  • über 300 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Testen Sie jetzt 30 Tage kostenlos.

Literatur
Über diesen Artikel

Weitere Artikel der Ausgabe 2/2015

International Journal of Speech Technology 2/2015 Zur Ausgabe