Skip to main content
Top

2012 | OriginalPaper | Chapter

7. Merkmalextraktion und Klassifikation

Author : Prof. Dr. -Ing. Klaus Fellbaum

Published in: Sprachverarbeitung und Sprachübertragung

Publisher: Springer Berlin Heidelberg

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

Merkmalextraktion und Klassifikation sind außerordentlich wichtige Verarbeitungsstufen für die Sprach- und Sprechererkennung; sie spielen darüber hinaus aber auch eine ebenso bedeutende Rolle bei jeglicher Form der Mustererkennung. Während die Merkmalextraktion vor allem dazu dient, das zu analysierende Datenmaterial (hier: Sprache) auf ein Minimum zu reduzieren, um auf diese Weise Verarbeitungsaufwand zu sparen sowie die wesentlichen Merkmale heraus zu „destillieren“, besteht die Aufgabe der Klassifikation darin, den analysierten Merkmalen Bedeutungen zuzuordnen. Es werden einige der wichtigsten Merkmalextraktionsverfahren vorgestellt. Bei der Klassifikation stehen statistische Klassifikatoren (Bayes-Klassifikator, Hidden-Markov-Modelle), neuronale Netze sowie Abstandsklassifikatoren, und schliesslich die dynamische Zeitnormierung im Vordergrund.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literature
go back to reference Benesty J, Sondhi MM, Huang Y (Hrsg) (2008) Springer handbook of speech processing. Berlin, Heidelberg Benesty J, Sondhi MM, Huang Y (Hrsg) (2008) Springer handbook of speech processing. Berlin, Heidelberg
go back to reference Braun H, u. a (1996) Praktikum Neuronale Netze. Springer-Verlag, Berlin, Heidelberg, New YorkMATH Braun H, u. a (1996) Praktikum Neuronale Netze. Springer-Verlag, Berlin, Heidelberg, New YorkMATH
go back to reference Deller Jr JR et al (1993) Discrete-time processing of speech signals. Macmillan Publishing Company, New York Deller Jr JR et al (1993) Discrete-time processing of speech signals. Macmillan Publishing Company, New York
go back to reference Euler S (2006) Grundkurs Spracherkennung. Friedr. Vieweg&Sohn Verlag, GWV FachverlageGmbH, Wiesbaden Euler S (2006) Grundkurs Spracherkennung. Friedr. Vieweg&Sohn Verlag, GWV FachverlageGmbH, Wiesbaden
go back to reference Hardt D (2001) Textabhängige und phonetisch-basierte Sprecherverifizierung für den Einsatz in der Telekommunikation (Diss.). Wissenschaft&Technik Verlag, Berlin Hardt D (2001) Textabhängige und phonetisch-basierte Sprecherverifizierung für den Einsatz in der Telekommunikation (Diss.). Wissenschaft&Technik Verlag, Berlin
go back to reference Hermansky H (1990) Perceptual linear predictive (PLP) analysis of speech. J Acoust Soc Am 87(2) Hermansky H (1990) Perceptual linear predictive (PLP) analysis of speech. J Acoust Soc Am 87(2)
go back to reference Hermansky H et al (1992) RASTA-PLP speech analysis technique. Proceedings of the international conference on acoustics, signal and speech processing. San Francisco California Hermansky H et al (1992) RASTA-PLP speech analysis technique. Proceedings of the international conference on acoustics, signal and speech processing. San Francisco California
go back to reference Hoffmann R (1998) Signalanalyse und -erkennung. Eine Einführung für Informationstechniker. Springer Verlag, Berlin, Heidelberg, New YorkMATHCrossRef Hoffmann R (1998) Signalanalyse und -erkennung. Eine Einführung für Informationstechniker. Springer Verlag, Berlin, Heidelberg, New YorkMATHCrossRef
go back to reference Itakura F (1975) Minimum prediction residual principle applied to speech recognition. IEEE Trans. on Acoustics, Speech and Signal Processing 23(1) Itakura F (1975) Minimum prediction residual principle applied to speech recognition. IEEE Trans. on Acoustics, Speech and Signal Processing 23(1)
go back to reference Jurafsky D, Martin JH (2009) Speech and language processing. Pearson Prentice-Hall, New Jersey Jurafsky D, Martin JH (2009) Speech and language processing. Pearson Prentice-Hall, New Jersey
go back to reference Kinnebrock W (1992) Neuronale Netze. Grundlagen, Anwendungen, Beispiele. R. Oldenbourg Verlag, München, WienMATH Kinnebrock W (1992) Neuronale Netze. Grundlagen, Anwendungen, Beispiele. R. Oldenbourg Verlag, München, WienMATH
go back to reference Kratzer KP (1990) Neuronale Netze. Grundlagen und Anwendungen. Carl Hanser Verlag, München, Wien Kratzer KP (1990) Neuronale Netze. Grundlagen und Anwendungen. Carl Hanser Verlag, München, Wien
go back to reference Lippmann RP (1987) An introduction to computing with neural nets. IEEE ASSP Magazine Lippmann RP (1987) An introduction to computing with neural nets. IEEE ASSP Magazine
go back to reference Meyer-Brötz G, Schürmann J (1970) Methoden der automatischen Zeichenerkennung. R. Oldenbourg, MünchenMATH Meyer-Brötz G, Schürmann J (1970) Methoden der automatischen Zeichenerkennung. R. Oldenbourg, MünchenMATH
go back to reference Ohm JR, Lüke HD (2002) Signalübertragung, 8. Aufl. Springer Verlag, Berlin, Heidelberg uswCrossRef Ohm JR, Lüke HD (2002) Signalübertragung, 8. Aufl. Springer Verlag, Berlin, Heidelberg uswCrossRef
go back to reference Paulus E (1998) Sprachsignalverarbeitung. Analyse, Erkennung, Synthese. Spektrum Akademischer Verlag, Heidelberg, Berlin Paulus E (1998) Sprachsignalverarbeitung. Analyse, Erkennung, Synthese. Spektrum Akademischer Verlag, Heidelberg, Berlin
go back to reference Pfister B, Kaufmann T (2008) Sprachverarbeitung. Grundlagen und Methoden der Sprachsynthese und Spracherkennung. Springer Verlag, Berlin, Heidelberg Pfister B, Kaufmann T (2008) Sprachverarbeitung. Grundlagen und Methoden der Sprachsynthese und Spracherkennung. Springer Verlag, Berlin, Heidelberg
go back to reference Rabiner L, Juang BH (1993) Fundamentals of speech recognition. Prentice-Hall, Englewood Cliffs, N.J. Rabiner L, Juang BH (1993) Fundamentals of speech recognition. Prentice-Hall, Englewood Cliffs, N.J.
go back to reference Rabiner LR (1989) A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE 77(2) Rabiner LR (1989) A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE 77(2)
go back to reference Rabiner LR et al (1978) Considerations in dynamic time warping algorithms for discrete word recognition, vol. ASSP-26. IEEE Trans. on Acoustics Speech and Signal Processing Rabiner LR et al (1978) Considerations in dynamic time warping algorithms for discrete word recognition, vol. ASSP-26. IEEE Trans. on Acoustics Speech and Signal Processing
go back to reference Rabiner LR, Juang BH (1986) An introduction to hidden Markov models. IEEE ASSP Magazine Rabiner LR, Juang BH (1986) An introduction to hidden Markov models. IEEE ASSP Magazine
go back to reference Rabiner LR, Schafer RW (1978) Digital processing of speech signals. Prentice-Hall Inc., Englewood Cliffs, New Jersey Rabiner LR, Schafer RW (1978) Digital processing of speech signals. Prentice-Hall Inc., Englewood Cliffs, New Jersey
go back to reference Rojas R (1993) Theorie der neuronalen Netze. Springer Lehrbuch. Springer Verlag, Berlin uswCrossRef Rojas R (1993) Theorie der neuronalen Netze. Springer Lehrbuch. Springer Verlag, Berlin uswCrossRef
go back to reference Rosenblatt F (1958) The perceptron: A probabilistic model for information storage and organization in the brain, vol. 65. Psychol Rev Rosenblatt F (1958) The perceptron: A probabilistic model for information storage and organization in the brain, vol. 65. Psychol Rev
go back to reference Rumelhart DE, McCelland JL (1986) Parallel distributed processing: Explorations in the microstructure of cognition. MIT Press, Cambridge, Mass Rumelhart DE, McCelland JL (1986) Parallel distributed processing: Explorations in the microstructure of cognition. MIT Press, Cambridge, Mass
go back to reference Ruske G (1988) Automatische Spracherkennung. Methoden der KLassifikation und Merkmalsextraktion. R. Oldenbourg Verlag, München. Wien Ruske G (1988) Automatische Spracherkennung. Methoden der KLassifikation und Merkmalsextraktion. R. Oldenbourg Verlag, München. Wien
go back to reference Sakoe H, Chiba S (1978) Dynamic programming algorithms optimization for spoken word recognition, vol. ASSP-26. IEEE Transactions on Acoustics, Speech and Signal Processing Sakoe H, Chiba S (1978) Dynamic programming algorithms optimization for spoken word recognition, vol. ASSP-26. IEEE Transactions on Acoustics, Speech and Signal Processing
go back to reference Schukat-Talamazzini EG (1995) Automatische Spracherkennung. Friedr. Vieweg&Sohn Verlagsgesellschaft mbH, Braunschweig Schukat-Talamazzini EG (1995) Automatische Spracherkennung. Friedr. Vieweg&Sohn Verlagsgesellschaft mbH, Braunschweig
go back to reference Schürer T (1995) Sprecherunabhängige Ziffern- und Ziffernkettenerkennung über Telefonkanäle, Dissertation. TU Berlin D 83, Berlin Schürer T (1995) Sprecherunabhängige Ziffern- und Ziffernkettenerkennung über Telefonkanäle, Dissertation. TU Berlin D 83, Berlin
go back to reference Sickert K (1983) Automatische Spracheingabe und Sprachausgabe. Verlag Markt und Technik, Haar b. München Sickert K (1983) Automatische Spracheingabe und Sprachausgabe. Verlag Markt und Technik, Haar b. München
go back to reference Stanley J, Bak E (1991) Neuronale Netze. Computersimulation biologischer Intelligenz. Systhema Verlag GmbH, München Stanley J, Bak E (1991) Neuronale Netze. Computersimulation biologischer Intelligenz. Systhema Verlag GmbH, München
go back to reference Wendemuth A (2004) Grundlagen der stochastischen Sprachverarbeitung. Oldenbourg Verlag, MünchenCrossRef Wendemuth A (2004) Grundlagen der stochastischen Sprachverarbeitung. Oldenbourg Verlag, MünchenCrossRef
go back to reference Widrow B, Hoff ME (1960) Adaptive switching circuits. IRE WESCON Convention Records, New York Widrow B, Hoff ME (1960) Adaptive switching circuits. IRE WESCON Convention Records, New York
go back to reference Young S, Bloothooft G (1997) Corpus-based methods in language and speech processing. Kluwer Academic Publishers, Dordrecht, Boston, LondonMATHCrossRef Young S, Bloothooft G (1997) Corpus-based methods in language and speech processing. Kluwer Academic Publishers, Dordrecht, Boston, LondonMATHCrossRef
Metadata
Title
Merkmalextraktion und Klassifikation
Author
Prof. Dr. -Ing. Klaus Fellbaum
Copyright Year
2012
Publisher
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-642-31503-9_7