Zum Inhalt

Leveraging EfficientNet Architectures for Noise Robust Speech Recognition: An Empirical Study with AudioMNIST Dataset

  • 2026
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Diese Studie untersucht die Leistungsfähigkeit von EfficientNet-Architekturen zur Spracherkennung in lauten Umgebungen unter Verwendung des AudioMNIST-Datensatzes. Die Studie vergleicht verschiedene EfficientNet-Varianten (B0 bis B7) mit herkömmlichen maschinellen Lernmodellen und konzentriert sich dabei auf deren Genauigkeit und Recheneffizienz. Schlüsselergebnisse zeigen, dass EfficientNet-Modelle, insbesondere EfficientNet B0, herkömmlichen Methoden überlegen sind und selbst unter erheblichen Geräuschbedingungen eine hohe Genauigkeit aufweisen. Die Studie untersucht auch die Auswirkungen unterschiedlicher Geräuscharten und Intensitäten auf die Spracherkennungsleistung. Darüber hinaus wird das Potenzial von EfficientNet für Echtzeit-Anwendungen diskutiert und zukünftige Richtungen für weitere Untersuchungen vorgeschlagen. Die detaillierten Analysen und vergleichenden Ergebnisse liefern wertvolle Erkenntnisse für Fachleute, die die Robustheit und Effizienz von Spracherkennungssystemen verbessern wollen.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Leveraging EfficientNet Architectures for Noise Robust Speech Recognition: An Empirical Study with AudioMNIST Dataset
Verfasst von
Arpita Choudhury
Amisha Singh
Pinki Roy
Sivaji Bandyopadhyay
Copyright-Jahr
2026
DOI
https://doi.org/10.1007/978-3-032-07735-6_22
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Bild 1 Verspätete Verkaufsaufträge (Sage-Advertorial 3/2026)/© Sage, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen in 2025 und 2026/© amgun | Getty Images