Zum Inhalt

Temperature controlled PSO on optimizing the DBN parameters for phoneme classification

  • 10.01.2019
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Speech recognition has become an essential component to communicate with the latest gadgets and machines in ease through speech. Phoneme classification model for phonemes in Tamil continuous speech is built here by exploring the power of deep belief network (DBN), a powerful neural network architecture that is capable of learning complex problems. But building an efficient DBN highly relies on several parameters like number of layers, number of neurons, connection weights and bias. The effect of increasing the number of layers in DBN for phoneme recognition has been studied in our previous experiments. In addition, a methodology which employed particle swarm optimization (PSO) or its variants second generation PSO (SGPSO) and new method PSO (NMPSO) for optimizing the connection weights and bias of the DBN for phoneme classification were studied in our earlier work. Pre-training DBN with PSO faced the problem of particle stagnation and took longer time to converge, whereas DBN with SGPSO, NMPSO converges faster but still suffers from particle stagnation which prevents it from reaching an optimal solution. Here we try to minimize stagnation of particles in the population in addition to faster convergence by proposing a new improved PSO, named Temperature controlled TPSO to optimize the initial connection weights and bias parameters that controls the DBN efficiency. TPSO seems to converge faster with better optimizing the DBN connection weights and bias parameters when compared to the existing ones with reduced stagnation of population. The TPSO–DBN is designed and applied on a phoneme classification problem for Tamil continuous speech and found to classify phonemes comparatively better with a classification accuracy of 89.2%.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Temperature controlled PSO on optimizing the DBN parameters for phoneme classification
Verfasst von
B. R. Laxmi Sree
M. S. Vijaya
Publikationsdatum
10.01.2019
Verlag
Springer US
Erschienen in
International Journal of Speech Technology / Ausgabe 1/2019
Print ISSN: 1381-2416
Elektronische ISSN: 1572-8110
DOI
https://doi.org/10.1007/s10772-018-09586-2
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.