nach oben

Erschienen in:

2019 | OriginalPaper | Buchkapitel

Speaker Recognition Using Occurrence Pattern of Speech Signal

verfasst von : Saptarshi Sengupta, Ghazaala Yasmin, Arijit Ghosal

Erschienen in: Recent Trends in Signal and Image Processing

Verlag: Springer Singapore

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Abstract

Speaker recognition is a highly studied area in the field of speech processing. Its application domains are many ranging from the forensic sciences to telephone banking and intelligent voice-driven applications such as answering machines. The area of study of this paper is a sub-field of speaker recognition called speaker identification. A new approach for tackling this problem with the use of one of the most powerful features of audio signals i.e. MFCC is proposed in this paper. Our work also makes use of the concept of co-occurrence matrices and derives statistical measures from it which are incorporated into the proposed feature vector. Finally, we apply a classifier which correctly identifies the person based on their speech sample. The work proposed here is perhaps one of the first to make use of such an arrangement, and results show that it is a highly promising strategy.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Speech and Non-speech Audio Files Discrimination Extracting Textural and Acoustic Features

Reynolds DA (1995) Automatic speaker recognition using Gaussian mixture speaker models. Lincoln Lab J

Dudeja K, Kharbanda A (2015) Applications of digital signal processing to speech recognition. Int J Res 2(5):191–194

XU HH (2015) Text dependent speaker recognition study

Revathi A, Ganapathy R, Venkataramani Y (2009) Text independent speaker recognition and speaker independent speech recognition using iterative clustering approach. Int J Comput Sci Inf Technol (IJCSIT) 1(2):30–42

Reynolds DA, Quatieri TF, Dunn RB (2000) Speaker verification using adapted Gaussian mixture models. Digit Signal Process 10(1–3):19–41CrossRef

Kua JMK et al (2010) Investigation of spectral centroid magnitude and frequency for speaker recognition. Odyssey 34–39

Doddington GR (2001) Speaker recognition based on idiolectal differences between speakers. Interspeech 2521–2524

Suraina K, Vig R (2015) A mfcc integrated vector quantization model for speaker recognition. Int J Comput Sci Mob Comput 4(5):294–400

Paul D, Parekh Ranjan (2011) Automated speech recognition of isolated words using neural networks. Int J Eng Sci Technol (IJEST) 3(6):4993–5000

10.

Otero PL (2015) Improved strategies for speaker segmentation and emotional state detection

11.

Campbell JP (1997) Speaker recognition: a tutorial. Proc IEEE 85(9):1437–1462CrossRef

12.

Atame S, Shanthi Therese S, Madhuri G (2015) A survey on: continuous voice recognition techniques. Int J Emerg Trends Technol Comput Sci (IJETTCS) 4(3):37–41

13.

Mermelstein P (1976) Distance measures for speech recognition, psychological and instrumental. Pattern Recog Artif Intell 116:374–388

14.

Haralick RM (1979) Statistical and structural approaches to texture. Proc IEEE 67(5):786–804CrossRef

15.

Lartillot O, Toiviainen P, Eerola T (2008) A matlab toolbox for music information retrieval. In: Data analysis, machine learning and applications, pp 261–268CrossRef

16.

Perrachione TK (2017) Speaker recognition across languages. Oxford University Press

Titel: Speaker Recognition Using Occurrence Pattern of Speech Signal
verfasst von: Saptarshi Sengupta
Ghazaala Yasmin
Arijit Ghosal
Verlag: Springer Singapore
Buch: Recent Trends in Signal and Image Processing
Print ISBN: 978-981-10-8862-9

Electronic ISBN: 978-981-10-8863-6

Copyright-Jahr: 2019
DOI: https://doi.org/10.1007/978-981-10-8863-6_21

Neuer Inhalt

Bildnachweise

VDI-Icon, Profil Icon, inhalt2, Springer Professional Modul/© Springer Fachmedien Wiesbaden GmbH, Nachhaltigkeitsaward Key Visual/© Cometis AG/Global ESG Monitor | Daniel Rupp | Generiert mit KI, Search Icon, Banner Hanser, Arbeitszeit/© granata68 / Fotolia, E-Autos im Fuhrpark: Lohnt sich das noch?/© Petair / stock.adobe.com, Kryptowährungen/© gopixa / Getty Images / iStock, Zeitschrift Wissensmanagement Cover, PatentFit-Logo/© Springer Fachmedien Wiesbaden GmbH, Sustainibility Finance/© Robert Kneschke / stock.adobe.com / Springer Fachmedien Wiesbaden GmbH, Zukunftswerkstatt Sales Excellence 2024/© AndreyPopov / Getty Images / iStock, 2023_Antrieb/© supervisuell

Springer Professional

Abstract

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Neuer Inhalt

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.