Zum Inhalt

Multi-scale Adaptive Feature Sparse Network for Speech Enhancement in Insect Noise Environments

  • 2025
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Insect noise (e.g., cicadas) is the primary noise interference in outdoor audio collection during summer and autumn. Current speech enhancement models suffer from ineffective multi-scale feature utilization and redundant information aggregation, hindering speech recovery. In order to more efficiently solve the interference of insect noise, this paper introduces a Multi-scale Adaptive Feature Sparse Network (MAFSNet). The Multi-scale Adaptive Sparse Conformer (MASC), serving as the cornerstone design of MAFSNet, comprises three pivotal constituent modules. Specifically, Multi-scale Adaptive Sparse Attention (MASA) module differentially processes multi-scale features at different levels, and then uses a dual-branch self-attention for adaptive redundancy reduction. Channel-guided Branch Modulation (CBM) module combines channel features with gating mechanisms to suppress irrelevant features of different branches. Meanwhile, Dual Scale Enhancement Fusion (DSEF) module implements learnable weighting for optimized feature fusion. The quantitative evaluations of the Insect Noise dataset and the Voice Bank+DEMAND dataset demonstrate that MAFSNet outperformed other models and achieved excellent results in objective evaluation metrics.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Titel
Multi-scale Adaptive Feature Sparse Network for Speech Enhancement in Insect Noise Environments
Verfasst von
Chao Zhang
Jian He
Xiangping Gao
Dongmei Zheng
Copyright-Jahr
2025
Verlag
Springer Nature Singapore
DOI
https://doi.org/10.1007/978-981-96-9805-9_40
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, NTT Data/© NTT Data, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, FAST LTA/© FAST LTA, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, WSW Software GmbH/© WSW Software GmbH, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH