Skip to main content

2022 | OriginalPaper | Buchkapitel

Convolutional Encoder–Decoder Architecture for Speech Enhancement

verfasst von : Utkarsh Maheshwari, Piyush Goel, R Annie Uthra, Vinay Vasanth Patage, Sourabh Tiwari, Saksham Goyal

Erschienen in: Proceedings of International Conference on Power Electronics and Renewable Energy Systems

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Signal processing faces the quandary of not being able to separate non-stationary noise from speech signal. Traditional methodologies relied on spectral subtraction for the same; however, such techniques relied on approximation of spectral mask of the noise. This paper proposes an effective and novel convolutional encoder–decoder architecture to effectuate clean speech from the input audio through denoising the audio input. The architecture uses skip connections to increase information flow from encoder to decoder, which helped the authors bolster the performance of the network. The generated output is evaluated on objective and subjective metrics like signal-to-noise ratio (SDR), perceptual evaluation of speech quality (PESQ) and short time objective intelligibility (STOI). The proposed system outperforms the state-of-the-art systems with respect to SDR, PESQ and STOI. The architecture finds applications in various fields such as speech recognition, machine translation and telecommunication.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Literatur
5.
Zurück zum Zitat Jansson A, Humphrey E, Montecchio N, Bittner R, Kumar A, Weyde T (2017) Singing voice separation with deep U-Net convolutional networks, pp 7 Jansson A, Humphrey E, Montecchio N, Bittner R, Kumar A, Weyde T (2017) Singing voice separation with deep U-Net convolutional networks, pp 7
Metadaten
Titel
Convolutional Encoder–Decoder Architecture for Speech Enhancement
verfasst von
Utkarsh Maheshwari
Piyush Goel
R Annie Uthra
Vinay Vasanth Patage
Sourabh Tiwari
Saksham Goyal
Copyright-Jahr
2022
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-16-4943-1_34