Skip to main content

2015 | OriginalPaper | Buchkapitel

Automatic Phoneme Border Detection to Improve Speech Recognition

verfasst von : Suárez-Guerra Sergio, Juárez-Murillo Cristian-Remington, Oropeza-Rodríguez José Luis

Erschienen in: Advances in Artificial Intelligence and Soft Computing

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

A comparative study of speech recognition performance among systems trained with manually labeled corpora and systems trained with semiautomatically labeled corpora is introduced. An automatic labeling system was designed to generate phoneme labels files for all words within the corpus used to train a system of automatic speech recognition. Speech recognition experiments were performed using the same corpus, first training with manually, and later with automatically generated labels. Results show that the recognition performance is better when the training of selected diccionary, is made with automatic label files than when it is made with manual label files. Not only is the automatic labeling of speech corpora faster than manual labeling, but also it is free from the subjectivity inherent in the manual segmentation performed by specialists. The performance achieved in this work is greater than 96 %.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Zurück zum Zitat Becchetti, C., Ricotti, L.C.: Speech Recognition. Theory and C ++ Implementation, pp. 305–307. Wiley, New York (1999) Becchetti, C., Ricotti, L.C.: Speech Recognition. Theory and C ++ Implementation, pp. 305–307. Wiley, New York (1999)
Zurück zum Zitat Fantinato, P.C., et al.: A Fractal-based approach for speech segmentation. In: Tenth IEEE International Symposium on Multimedia, ISM 2008, 15–17 December 2008, pp. 551–555 (2008). doi:10.1109/ISM.2008.123 Fantinato, P.C., et al.: A Fractal-based approach for speech segmentation. In: Tenth IEEE International Symposium on Multimedia, ISM 2008, 15–17 December 2008, pp. 551–555 (2008). doi:10.​1109/​ISM.​2008.​123
Zurück zum Zitat Galka, J., Ziolko, M.: Wavelets in speech segmentation. In: The 14th IEEE Mediterranean Electrotechnical Conference, MELECON 2008, 5–7 May 2008, pp. 876–879 (2008) Galka, J., Ziolko, M.: Wavelets in speech segmentation. In: The 14th IEEE Mediterranean Electrotechnical Conference, MELECON 2008, 5–7 May 2008, pp. 876–879 (2008)
Zurück zum Zitat Hosom, J.P.: Automatic time alignment of phonemes using acoustic-phonetic information. Oregon Graduate Institute of Science and Technology. Ph.D. thesis, pp. 121–122 (2000) Hosom, J.P.: Automatic time alignment of phonemes using acoustic-phonetic information. Oregon Graduate Institute of Science and Technology. Ph.D. thesis, pp. 121–122 (2000)
Zurück zum Zitat Bansal, P., et al.: Speech synthesis – automatic segmentation. Int. J. Comput. Appl. (0975–8887) 98 (4), (2014) Bansal, P., et al.: Speech synthesis – automatic segmentation. Int. J. Comput. Appl. (0975–8887) 98 (4), (2014)
Zurück zum Zitat Ziolko, B., Manandhar, S., Wilson, R.C.: Phoneme segmentation of speech. In: 18th International Conference on Pattern Recognition, ICPR 2006, vol. 4, pp. 282–285 (2006). doi:10.1109/ICPR.2006.931 Ziolko, B., Manandhar, S., Wilson, R.C.: Phoneme segmentation of speech. In: 18th International Conference on Pattern Recognition, ICPR 2006, vol. 4, pp. 282–285 (2006). doi:10.​1109/​ICPR.​2006.​931
Metadaten
Titel
Automatic Phoneme Border Detection to Improve Speech Recognition
verfasst von
Suárez-Guerra Sergio
Juárez-Murillo Cristian-Remington
Oropeza-Rodríguez José Luis
Copyright-Jahr
2015
DOI
https://doi.org/10.1007/978-3-319-27060-9_11

Premium Partner