nach oben

Erschienen in:

2013 | OriginalPaper | Buchkapitel

29. Time-Delay Neural Network with 3 Frequency Bands Based on Voiced Speech Discrimination in Noise

verfasst von : Jae Seung Choi

Erschienen in: Future Information Communication Technology and Applications

Verlag: Springer Netherlands

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Abstract

Information on the time variation in a speech signal is significant when training a neural network for the speech signal input. Therefore, this paper proposes a time-delay neural network with 3 frequency bands based on voiced speech discrimination in the condition of background noises. The effectiveness of the proposed network is experimentally confirmed based on measuring the correct discrimination rates for speech degraded by various noises.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Enhancing Document Clustering Using Reweighting Terms Based on Semantic Features

Nächstes Kapitel Linear Prediction-Based Reconstruction of Electrocardiogram with Premature Ventricular Contraction for Heart Rate Variability Analysis

Juang CF, Chiou CT, Lai CL (2007) Hierarchical singleton-type recurrent neural fuzzy networks for noisy speech recognition. IEEE Trans Neural Netw 18(3):833–843CrossRef

Knecht WG, Schenkel ME, Moschytz GS (1995) Neural network filters for speech enhancement. IEEE Trans. Speech Audio Process 3(6):433–438

Cong L, Asghar S, Cong B (2000) Robust speech recognition using neural networks and hidden Markov models. In: Proceedings of the international on Information technology: coding and computing, pp 350–354

Choi JS (2012) Speech processing system using a noise reduction neural network based on FFT spectrums. J Inf Commun Convergence Eng 10(2):162–167CrossRef

Hampshire JB, Waibel AH (1990) A novel objective function for improved phoneme recognition using time delay neural networks. IEEE Trans Neural Netw 1(2):216–228

Choi JS, Park SJ (2007) Speech enhancement system based on auditory system and time-delay neural network. In: 8th international conference on lecture notes in computer science. LNCS, Part II, pp 153–160

Peng Y, Xiong H, Guo C, Liu H, Zou J (2010) Research on the algorithm of communication network speech enhancement based on BP neural network. Int Conf Adv Comput Theor Eng 3:V3-559–V3-562

Vieira K, Wilamowski B, Kubichek R (1997) Speaker verification for security systems using artificial neural networks. Int Conf Ind Electron Control Instrum 3:1102–1107

Rumelhart DE, Hinton GE, Williams RJ (1986) Learning representations by back-propagation errors. Nature 323:533–536CrossRef

10.

Hirsch H, Pearce D (2000) The AURORA experimental framework for the performance evaluations of speech recognition systems under noisy conditions. In: Proceedings of the ISCA ITRW ASR2000 on automatic speech recognition: challenges for the next millennium, Paris, France

11.

Leonard RG (1984) A database for speaker independent digit recognition. In: IEEE international conference on acoustics, speech, and signal processing, pp 328–331

12.

ITU-T (International Telecommunication Union) Recommendation G. 712 (1996) Transmission performance characteristics of pulse code modulation channels, pp 1–31

Titel: Time-Delay Neural Network with 3 Frequency Bands Based on Voiced Speech Discrimination in Noise
verfasst von: Jae Seung Choi
Verlag: Springer Netherlands
Buch: Future Information Communication Technology and Applications
Print ISBN: 978-94-007-6515-3

Electronic ISBN: 978-94-007-6516-0

Copyright-Jahr: 2013
DOI: https://doi.org/10.1007/978-94-007-6516-0_29

Neuer Inhalt

Bildnachweise

VDI-Icon, Profil Icon, inhalt2, Springer Professional Modul/© Springer Fachmedien Wiesbaden GmbH, Nachhaltigkeitsaward Key Visual/© Cometis AG/Global ESG Monitor | Daniel Rupp | Generiert mit KI, Search Icon, Banner Hanser, Beijing Auto Show 2024: Deutsche Hersteller wollen angreifen./© EKH-Pictures / Generated with AI / Stock.adobe.com, Buchstaben, die aus einem Megaphon kommen/© MicroStockHub/Getty Images/iStock, Digitale Lieferkette/© zapp2photo / stock.adobe.com, Zeitschrift Wissensmanagement Cover, PatentFit-Logo/© Springer Fachmedien Wiesbaden GmbH, Sustainibility Finance/© Robert Kneschke / stock.adobe.com / Springer Fachmedien Wiesbaden GmbH, Zukunftswerkstatt Sales Excellence 2024/© AndreyPopov / Getty Images / iStock, 2023_Antrieb/© supervisuell

Springer Professional

Abstract

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Neuer Inhalt

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.