Skip to main content

2020 | OriginalPaper | Buchkapitel

An Improved State Coherence Transform Algorithm for the Location of Dual Microphone with Multiple Sources

verfasst von : Shan Qin, Ting Jiang

Erschienen in: Communications, Signal Processing, and Systems

Verlag: Springer Singapore

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

This paper proposes a new kernel function in state coherence transform to perform multiple time difference of arrival estimation in order to increase the resolution of location in frequency-domain blind source separation. The state coherence transform associated with each source generalizes the GCC for multiple sources and generates envelopes with clear peaks corresponding to the maximum-likelihood TDOAs. However, the weight allocation of the kernel function is unreasonable for small spacing microphones. We propose an improved kernel function to enhance the resolution of small values, which means that a larger weight allocated to smaller values. Experimental results show that the proposed approach allows to separate four speakers, using very short utterances, in highly reverberant environment even with small-spaced microphones of 2 cm.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Hosseini MS, Rezaie A, Zanjireh Y. Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function. Sci Iran. 2017;24(6). Hosseini MS, Rezaie A, Zanjireh Y. Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function. Sci Iran. 2017;24(6).
2.
Zurück zum Zitat Jia RS, Gong Y, Peng YJ, Sun HM, Zhang XL, Lu XM. Time difference of arrival estimation of microseismic signals based on alpha-stable distribution. 2017; p. 1–17. Jia RS, Gong Y, Peng YJ, Sun HM, Zhang XL, Lu XM. Time difference of arrival estimation of microseismic signals based on alpha-stable distribution. 2017; p. 1–17.
3.
Zurück zum Zitat Zhu H, Li Z, Cheng Q. Sound source localization through optimal peak association in reverberant environments. 2017; p. 1–6). Zhu H, Li Z, Cheng Q. Sound source localization through optimal peak association in reverberant environments. 2017; p. 1–6).
5.
Zurück zum Zitat Wood SU, Rouat J. Real-time speech enhancement with GCC-NMF. In: INTERSPEECH. 2017 Wood SU, Rouat J. Real-time speech enhancement with GCC-NMF. In: INTERSPEECH. 2017
6.
Zurück zum Zitat Nesta F, Omologo M. Generalized state coherence transform for multidimensional TDOA estimation of multiple sources. IEEE Trans Audio Speech Lang Process. 2012;20(1):246–60.CrossRef Nesta F, Omologo M. Generalized state coherence transform for multidimensional TDOA estimation of multiple sources. IEEE Trans Audio Speech Lang Process. 2012;20(1):246–60.CrossRef
7.
Zurück zum Zitat Azadi M, Abutalebi HR. Modified state coherence transform to reduce spatial aliasing in TDOA estimation of multiple sound sources. In: International symposium on telecommunications. IEEE; 2015. p. 492–6 Azadi M, Abutalebi HR. Modified state coherence transform to reduce spatial aliasing in TDOA estimation of multiple sound sources. In: International symposium on telecommunications. IEEE; 2015. p. 492–6
8.
Zurück zum Zitat Nesta F, Omologo M. Generalized state coherence transform for multidimensional localization of multiple sources. In: Applications of signal processing to audio and acoustics, 2009. WASPAA ‘09. IEEE workshop on Vol.4. IEEE; 2009. p. 2360–71 Nesta F, Omologo M. Generalized state coherence transform for multidimensional localization of multiple sources. In: Applications of signal processing to audio and acoustics, 2009. WASPAA ‘09. IEEE workshop on Vol.4. IEEE; 2009. p. 2360–71
Metadaten
Titel
An Improved State Coherence Transform Algorithm for the Location of Dual Microphone with Multiple Sources
verfasst von
Shan Qin
Ting Jiang
Copyright-Jahr
2020
Verlag
Springer Singapore
DOI
https://doi.org/10.1007/978-981-13-6504-1_130