Zum Inhalt

Spoof Speech Detection Based on Raw Cross-Dimension Interaction Attention Network

  • 2022
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Das Kapitel stellt eine neuartige Ende-zu-Ende-Methode zur Spracherkennung vor, die Raw-Audio-Wellenformen und ein interdimensionales Aufmerksamkeitsnetzwerk nutzt. Dieser Ansatz adressiert die Beschränkungen traditioneller Methoden, indem er Audiorohdaten direkt verarbeitet, mehrdimensionale Falschmeldungen erfasst und die Fähigkeit des Modells verbessert, Spoofing-Angriffe zu erkennen. Das vorgeschlagene Raw Cross-dimension Interaction Attention Network (Raw CIANet) umfasst eine Technik zur Kanalmaskierung, um diskriminierende Merkmale hervorzuheben, und ein leichtes spektralzeitliches Aufmerksamkeitsmodul für effiziente grenzüberschreitende Interaktion. Das Kapitel untersucht auch verschiedene Strategien zur Aufmerksamkeitsfusion, um die Erfassung diskriminierender Merkmale zu maximieren. Experimentelle Ergebnisse des ASVspoof 2019 LA-Datensatzes zeigen die überlegene Leistung des Raw CIANet im Vergleich zu bestehenden hochmodernen Modellen und zeigen sein Potenzial für den Einsatz in Echtzeit-Spracherkennungssystemen.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Spoof Speech Detection Based on Raw Cross-Dimension Interaction Attention Network
Verfasst von
Ye Zhou
Jianwu Zhang
Pengguo Zhang
Copyright-Jahr
2022
DOI
https://doi.org/10.1007/978-3-031-20233-9_63
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Bild 1 Verspätete Verkaufsaufträge (Sage-Advertorial 3/2026)/© Sage, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen in 2025 und 2026/© amgun | Getty Images