Skip to main content
Erschienen in: Acoustical Physics 4/2023

01.08.2023 | ACOUSTIC SIGNALS PROCESSING. COMPUTER SIMULATION

Distant Speech Detection

verfasst von: V. N. Sorokin

Erschienen in: Acoustical Physics | Ausgabe 4/2023

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The article studies the amplitude and phase responses of speech signals recorded at different distances from the speaker by various types of microphones in free space and in a closed room. The ratios of the average energy of the amplitude spectrum in different frequency ranges and the average slope of the linear phase component show differences for a syllable recorded near a microphone and the same syllable recorded distantly and again reproduced near the microphone. The greatest difference is observed in the average-energy ratios in the frequency ranges of 0–1 and 1–8, as well as 3–4 and 4–6 kHz. The slope of the linear component is calculated in the 4–8 kHz range. The degree of differentiation depends on the vowel sound.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Z. Wu, N. Evans, T. Kinnunen, J. Yamagishi, F. Alegre, and H. Li, Speech Commun. 66, 130 (2015).CrossRef Z. Wu, N. Evans, T. Kinnunen, J. Yamagishi, F. Alegre, and H. Li, Speech Commun. 66, 130 (2015).CrossRef
2.
Zurück zum Zitat T. Kinnunen, M. Sahidullah, H. Delgado, M. Todisco, N. Evans, J. Yamagishi, and K. A. Lee, in Proc. InterSpeech 2017 (Stockholm, 2017). T. Kinnunen, M. Sahidullah, H. Delgado, M. Todisco, N. Evans, J. Yamagishi, and K. A. Lee, in Proc. InterSpeech 2017 (Stockholm, 2017).
3.
Zurück zum Zitat M. Sahidullah, H. Delgado, M. Todisco, T. Kinnunen, N. Evans, J. Yamagishi, and K. A. Lee, in Handbook of Biometric Anti-Spoofing (Springer, Cham, 2019), p. 321. M. Sahidullah, H. Delgado, M. Todisco, T. Kinnunen, N. Evans, J. Yamagishi, and K. A. Lee, in Handbook of Biometric Anti-Spoofing (Springer, Cham, 2019), p. 321.
4.
Zurück zum Zitat K. A. Lee, O. Sadjadi, H. Li, and D. Reynolds, Comput. Speech Lang. 61, 101058 (2020).CrossRef K. A. Lee, O. Sadjadi, H. Li, and D. Reynolds, Comput. Speech Lang. 61, 101058 (2020).CrossRef
6.
Zurück zum Zitat Y. W. Lau, M. Wagner, and D. Tran, in Proc. IEEE Int. Symp. on Intelligent Multimedia, Video and Speech (Hong Kong, 2004), p. 145. Y. W. Lau, M. Wagner, and D. Tran, in Proc. IEEE Int. Symp. on Intelligent Multimedia, Video and Speech (Hong Kong, 2004), p. 145.
8.
Zurück zum Zitat A. Khodabakhsh, A. Mohammadi, and C. Demiroglu, Comput. Speech Lang. 42, 20 (2017).CrossRef A. Khodabakhsh, A. Mohammadi, and C. Demiroglu, Comput. Speech Lang. 42, 20 (2017).CrossRef
9.
Zurück zum Zitat B. Sisman, J. Yamagishi, S. King, and H. Li, IEEE/ACM Trans. Audio, Speech Lang. Proc. 29, 132 (2021). B. Sisman, J. Yamagishi, S. King, and H. Li, IEEE/ACM Trans. Audio, Speech Lang. Proc. 29, 132 (2021).
10.
Zurück zum Zitat J. Lindberg and M. Blomberg, in Proc. European Conf. on Speech Communication and Technology (Eurospeech) (Budapest, 1999), p. 1211. J. Lindberg and M. Blomberg, in Proc. European Conf. on Speech Communication and Technology (Eurospeech) (Budapest, 1999), p. 1211.
12.
Zurück zum Zitat Z. F. Wang, G. Wei, and Q. H. He, in Proc. IEEE Int. Conf. Machine Learning and Cybernetics (ICMLC) (Singapore, 2011), p. 1708. Z. F. Wang, G. Wei, and Q. H. He, in Proc. IEEE Int. Conf. Machine Learning and Cybernetics (ICMLC) (Singapore, 2011), p. 1708.
13.
Zurück zum Zitat J. Galka, M. Grzywacz, and R. Samborski, Speech Commun. 67, 143 (2015).CrossRef J. Galka, M. Grzywacz, and R. Samborski, Speech Commun. 67, 143 (2015).CrossRef
14.
Zurück zum Zitat A. J. Kolarik, B. C. J. Moore, P. Zahori, S. Cirstea, and S. Pardhan, Atten., Percept. Psychophys. 2 (78), 373 (2016).CrossRef A. J. Kolarik, B. C. J. Moore, P. Zahori, S. Cirstea, and S. Pardhan, Atten., Percept. Psychophys. 2 (78), 373 (2016).CrossRef
15.
Zurück zum Zitat E. Skudrzyk, The Foundations of Acoustics (Springer-Verlag, Wien 1971; Inostrannaya literatura, Moscow, 1959), Vol. 2. E. Skudrzyk, The Foundations of Acoustics (Springer-Verlag, Wien 1971; Inostrannaya literatura, Moscow, 1959), Vol. 2.
16.
17.
Zurück zum Zitat L. Prud’homme and M. Lavandier, J. Acoust. Soc. Am. 148 (3), 614 (2020).CrossRef L. Prud’homme and M. Lavandier, J. Acoust. Soc. Am. 148 (3), 614 (2020).CrossRef
19.
Zurück zum Zitat I. Spiousas, P. E. Etchemendy, M. C. Eguia, E. R. Calcagno, E. Abregú, and R. O. Vergara, Front. Psychol. 8, 969 (2017).CrossRef I. Spiousas, P. E. Etchemendy, M. C. Eguia, E. R. Calcagno, E. Abregú, and R. O. Vergara, Front. Psychol. 8, 969 (2017).CrossRef
21.
Zurück zum Zitat V. N. Sorokin and A. I. Tsyplikhin, Inf. Protsessy 10 (2), 87 (2010). V. N. Sorokin and A. I. Tsyplikhin, Inf. Protsessy 10 (2), 87 (2010).
22.
Zurück zum Zitat M. Witkowski, S. Kacprzak, P. Zelasko, K. Kowalczyk, and J. Gałka, in Proc. InterSpeech 2017 (Stockholm, 2017), p. 27. M. Witkowski, S. Kacprzak, P. Zelasko, K. Kowalczyk, and J. Gałka, in Proc. InterSpeech 2017 (Stockholm, 2017), p. 27.
23.
Zurück zum Zitat M. R. Kamble, H. Tak, and H. A. Patil, Speech Commun. 125, 114 (2020).CrossRef M. R. Kamble, H. Tak, and H. A. Patil, Speech Commun. 125, 114 (2020).CrossRef
24.
Zurück zum Zitat M. R. Kamble and H. A. Patil, Comput. Speech Lang. 65, 101140 (2021).CrossRef M. R. Kamble and H. A. Patil, Comput. Speech Lang. 65, 101140 (2021).CrossRef
25.
Zurück zum Zitat H. Teager, IEEE Trans. Acoust. Speech Signal Proc. 28 (5), 599 (1980).CrossRef H. Teager, IEEE Trans. Acoust. Speech Signal Proc. 28 (5), 599 (1980).CrossRef
26.
27.
Zurück zum Zitat Z. Oo, L. Wang, K. Phapatanaburi, M. Liu, S. Nakagawa, M. Iwahashi, and J. Dang, EURASIP J. Audio, Speech, Music, Art. No. 8 (2019). Z. Oo, L. Wang, K. Phapatanaburi, M. Liu, S. Nakagawa, M. Iwahashi, and J. Dang, EURASIP J. Audio, Speech, Music, Art. No. 8 (2019).
28.
Zurück zum Zitat M. Liu, L. Wang, J. Danga, K. A. Lee, and S. Nakagawa, Comput. Speech Lang. 66, 101161 (2021).CrossRef M. Liu, L. Wang, J. Danga, K. A. Lee, and S. Nakagawa, Comput. Speech Lang. 66, 101161 (2021).CrossRef
30.
Zurück zum Zitat J. L. Flanagan, Speech Analysis Synthesis and Perception (Springer-Verlag, Berlin, Heidelberg, New York, 1965; Svyaz’, Moscow, 1968). J. L. Flanagan, Speech Analysis Synthesis and Perception (Springer-Verlag, Berlin, Heidelberg, New York, 1965; Svyaz’, Moscow, 1968).
31.
Zurück zum Zitat P. M. Morse, Vibration and Sound (McGraw-Hill, 1948; Gos. izd. tekhniko-tekhnich. lit., Moscow-Leningrad, 1949). P. M. Morse, Vibration and Sound (McGraw-Hill, 1948; Gos. izd. tekhniko-tekhnich. lit., Moscow-Leningrad, 1949).
Metadaten
Titel
Distant Speech Detection
verfasst von
V. N. Sorokin
Publikationsdatum
01.08.2023
Verlag
Pleiades Publishing
Erschienen in
Acoustical Physics / Ausgabe 4/2023
Print ISSN: 1063-7710
Elektronische ISSN: 1562-6865
DOI
https://doi.org/10.1134/S1063771023600250

Weitere Artikel der Ausgabe 4/2023

Acoustical Physics 4/2023 Zur Ausgabe

    Marktübersichten

    Die im Laufe eines Jahres in der „adhäsion“ veröffentlichten Marktübersichten helfen Anwendern verschiedenster Branchen, sich einen gezielten Überblick über Lieferantenangebote zu verschaffen.