Zum Inhalt

End-to-end speaker identification research based on multi-scale SincNet and CGAN

  • 02.08.2023
  • Review
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Der Artikel diskutiert die Herausforderungen und Fortschritte bei der Lautsprecheridentifikation mittels tiefer neuronaler Netzwerke. Es führt ein neuartiges End-to-End-Erkennungssystem ein, das auf mehrskaligem SincNet und bedingten generativen feindlichen Netzwerken (CGANs) beruht. Dieses System löst Probleme wie kurze Spracherkennung, Datenverknappung und Überausstattung, indem es wichtige Schmalband-Lautsprechermerkmale erfasst und hochwertige synthetische Proben erzeugt. Die Methode wird durch umfangreiche Experimente mit öffentlichen Datensätzen wie LIBRISPEECH und TIMIT validiert, die eine überlegene Leistung im Vergleich zu herkömmlichen Methoden zeigen. Der Artikel beleuchtet auch das Potenzial dieses Ansatzes in realen Anwendungen wie dem VoxCeleb-Korpus und schlägt zukünftige Richtungen für weitere Optimierungen vor.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt 90 Tage mit der Mini-Lizenz testen!                                        

Hier klicken und sofort starten!

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
End-to-end speaker identification research based on multi-scale SincNet and CGAN
Verfasst von
Guangcun Wei
Yanna Zhang
Hang Min
Yunfei Xu
Publikationsdatum
02.08.2023
Verlag
Springer London
Erschienen in
Neural Computing and Applications / Ausgabe 30/2023
Print ISSN: 0941-0643
Elektronische ISSN: 1433-3058
DOI
https://doi.org/10.1007/s00521-023-08906-1
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data