Skip to main content
Erschienen in: e & i Elektrotechnik und Informationstechnik 3/2021

04.05.2021 | Review

Von Fotos zu personalisierter räumlicher Audiowiedergabe

verfasst von: Katharina Pollack, Fabian Brinkmann, Piotr Majdak, Wolfgang Kreuzer

Erschienen in: e+i Elektrotechnik und Informationstechnik | Ausgabe 3/2021

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Der Umgebungsschall wird von unserem Körper gefiltert, ehe er unsere Gehörgänge erreicht. Diese räumliche Filterung wird mit den sogenannten head-related transfer functions (HRTFs) beschrieben und ermöglicht unserem Gehör, Informationen über unsere Umgebung aus dem Schallfeld zu extrahieren. Eine genaue Kenntnis personenspezifischer HRTFs ist für personalisierte Kopfhörerwiedergabe essenziell, zum Beispiel in Systemen zur Darbietung hochqualitativer virtueller Realität. Während bisher personenspezifische HRTFs vorwiegend akustisch gemessen wurden, erlaubt die hohe Rechenleistung heutiger Computersysteme eine Alternative in der Form der numerischen Berechnung von HRTFs. Dabei können HRTFs auf dreidimensionaler Geometrien (3D-Geometrien) von Kopf und Ohrmuscheln der Testperson berechnet werden. Die 3D-Geometrien wiederum können, unter Einhaltung gewisser Bedingungen, sogar aus zweidimensionalen Fotos (2D-Fotos) der Testperson berechnet werden. In diesem Artikel stellen wir den aktuellen Stand der Forschung zur personenspezifischen Berechnung der HRTFs vor – von 2D-Fotos über 3D-Geometrien bis hin zu HRTFs.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Hier wurde Metashape 1.0 (Agisoft, Russia, https://​www.​agisoft.​com) verwendet.
 
Literatur
2.
Zurück zum Zitat Algazi, V. R., Avendano, C., Duda, R. O. (2001): Elevation localization and head-related transfer function analysis at low frequencies. J. Acoust. Soc. Am., 109(3), 1110–1122. CrossRef Algazi, V. R., Avendano, C., Duda, R. O. (2001): Elevation localization and head-related transfer function analysis at low frequencies. J. Acoust. Soc. Am., 109(3), 1110–1122. CrossRef
3.
Zurück zum Zitat Baumgartner, R., Reed, D. K., Tóth, B., Best, V., Majdak, P., Colburn, H. S., Shinn-Cunningham, B. (2017): Asymmetries in behavioral and neural responses to spectral cues demonstrate the generality of auditory looming bias. Proc. Natl. Acad. Sci., 114(36), 9743–9748. CrossRef Baumgartner, R., Reed, D. K., Tóth, B., Best, V., Majdak, P., Colburn, H. S., Shinn-Cunningham, B. (2017): Asymmetries in behavioral and neural responses to spectral cues demonstrate the generality of auditory looming bias. Proc. Natl. Acad. Sci., 114(36), 9743–9748. CrossRef
4.
Zurück zum Zitat Blauert, J. (1997): Spatial hearing: the psychophysics of human sound localization. Cambridge: MIT Press. Blauert, J. (1997): Spatial hearing: the psychophysics of human sound localization. Cambridge: MIT Press.
5.
Zurück zum Zitat Brinkmann, F., Dinakaran, M., Pelzer, R., Grosche, P., Voss, D., Weinzierl, S. (2019): A cross-evaluated database of measured and simulated HRTFs including 3D head meshes, anthropometric features, and headphone impulse responses. J. Audio Eng. Soc., 67(9), 705–718. https://doi.org/10.17743/jaes.2019.0024. CrossRef Brinkmann, F., Dinakaran, M., Pelzer, R., Grosche, P., Voss, D., Weinzierl, S. (2019): A cross-evaluated database of measured and simulated HRTFs including 3D head meshes, anthropometric features, and headphone impulse responses. J. Audio Eng. Soc., 67(9), 705–718. https://​doi.​org/​10.​17743/​jaes.​2019.​0024. CrossRef
6.
Zurück zum Zitat Brinkmann, F., Lindau, A., Weinzierl, S., van de Par, S., Müller-Trapet, M., Opdam, R., Vorländer, M. (2017): A high resolution and full-spherical head-related transfer function database for different head-above-torso orientations. J. Audio Eng. Soc., 65(10), 841–848. https://doi.org/10.17743/jaes.2017.0033. CrossRef Brinkmann, F., Lindau, A., Weinzierl, S., van de Par, S., Müller-Trapet, M., Opdam, R., Vorländer, M. (2017): A high resolution and full-spherical head-related transfer function database for different head-above-torso orientations. J. Audio Eng. Soc., 65(10), 841–848. https://​doi.​org/​10.​17743/​jaes.​2017.​0033. CrossRef
7.
Zurück zum Zitat Burton, A., Miller, G. (1971): The application of integral equation methods to the numerical solution of some exterior boundary-value problems. Proc. R. Soc. Lond. Ser. A, Math. Phys. Sci., 323(1553), 201–210. MathSciNetMATH Burton, A., Miller, G. (1971): The application of integral equation methods to the numerical solution of some exterior boundary-value problems. Proc. R. Soc. Lond. Ser. A, Math. Phys. Sci., 323(1553), 201–210. MathSciNetMATH
8.
Zurück zum Zitat Carlile, S. (1996): Virtual auditory space: generation and applications. Austin: RG Landes. 1996. CrossRef Carlile, S. (1996): Virtual auditory space: generation and applications. Austin: RG Landes. 1996. CrossRef
9.
Zurück zum Zitat Coifman, R., Rokhlin, V., Wandzura, S. (1993): The fast multipole method for the wave equation: a pedestrian prescription. IEEE Antennas Propag. Mag., 35(3), 7–12. CrossRef Coifman, R., Rokhlin, V., Wandzura, S. (1993): The fast multipole method for the wave equation: a pedestrian prescription. IEEE Antennas Propag. Mag., 35(3), 7–12. CrossRef
10.
12.
Zurück zum Zitat Hanrahan, P., Krueger, W. (1993): Reflection from layered surfaces due to subsurface scattering. In Proceedings of the 20th annual conference on computer graphics and interactive techniques (S. 165–174). Hanrahan, P., Krueger, W. (1993): Reflection from layered surfaces due to subsurface scattering. In Proceedings of the 20th annual conference on computer graphics and interactive techniques (S. 165–174).
13.
Zurück zum Zitat Jin, C. T., Guillon, P., Epain, N., Zolfaghari, R., Van Schaik, A., Tew, A. I., Hetherington, C., Thorpe, J. (2013): Creating the Sydney York morphological and acoustic recordings of ears database. IEEE Trans. Multimed., 16(1), 37–46. CrossRef Jin, C. T., Guillon, P., Epain, N., Zolfaghari, R., Van Schaik, A., Tew, A. I., Hetherington, C., Thorpe, J. (2013): Creating the Sydney York morphological and acoustic recordings of ears database. IEEE Trans. Multimed., 16(1), 37–46. CrossRef
14.
Zurück zum Zitat Kazhdan, M., Bolitho, M., Hoppe, H. (2006): Poisson surface reconstruction. In Proceedings of the fourth eurographics symposium on geometry processing (Bd. 7). Kazhdan, M., Bolitho, M., Hoppe, H. (2006): Poisson surface reconstruction. In Proceedings of the fourth eurographics symposium on geometry processing (Bd. 7).
15.
Zurück zum Zitat Kreuzer, W., Majdak, P., Chen, Z. (2009): Fast multipole boundary element method to calculate head-related transfer functions for a wide frequency range. J. Acoust. Soc. Am., 126(3), 1280–1290. CrossRef Kreuzer, W., Majdak, P., Chen, Z. (2009): Fast multipole boundary element method to calculate head-related transfer functions for a wide frequency range. J. Acoust. Soc. Am., 126(3), 1280–1290. CrossRef
17.
Zurück zum Zitat Majdak, P., Balazs, P., Laback, B. (2007): Multiple exponential sweep method for fast measurement of head-related transfer functions. J. Audio Eng. Soc., 55, 623–637. Majdak, P., Balazs, P., Laback, B. (2007): Multiple exponential sweep method for fast measurement of head-related transfer functions. J. Audio Eng. Soc., 55, 623–637.
18.
Zurück zum Zitat Majdak, P., Noisternig, M. (2015): Aes69-2015: Aes standard for file exchange-spatial acoustic data file format. In Audio Engineering Society. Majdak, P., Noisternig, M. (2015): Aes69-2015: Aes standard for file exchange-spatial acoustic data file format. In Audio Engineering Society.
19.
Zurück zum Zitat Marburg, S. (2002): Six boundary elements per wavelength: is that enough? J. Comput. Acoust., 10(01), 25–51. CrossRef Marburg, S. (2002): Six boundary elements per wavelength: is that enough? J. Comput. Acoust., 10(01), 25–51. CrossRef
20.
Zurück zum Zitat Møller, H., Sørensen, M. F., Hammershøi, D., Jensen, C. B. (1995): Head-related transfer functions of human subjects. J. Audio Eng. Soc., 43(5), 300–321. Møller, H., Sørensen, M. F., Hammershøi, D., Jensen, C. B. (1995): Head-related transfer functions of human subjects. J. Audio Eng. Soc., 43(5), 300–321.
21.
Zurück zum Zitat Pollack, K., Majdak, P., Furtado, H. (2020): A parametric pinna model for the calculations of head-related transfer functions. In Proceedings of forum acusticum, Lyon. Pollack, K., Majdak, P., Furtado, H. (2020): A parametric pinna model for the calculations of head-related transfer functions. In Proceedings of forum acusticum, Lyon.
22.
Zurück zum Zitat Reichinger, A., Majdak, P., Sablatnig, R., Maierhofer, S. (2013): Evaluation of methods for optical 3-d scanning of human pinnas. In 2013 international conference on 3D vision-3DV 2013 (S. 390–397). New York: IEEE Press. CrossRef Reichinger, A., Majdak, P., Sablatnig, R., Maierhofer, S. (2013): Evaluation of methods for optical 3-d scanning of human pinnas. In 2013 international conference on 3D vision-3DV 2013 (S. 390–397). New York: IEEE Press. CrossRef
24.
Zurück zum Zitat Saad, Y. (2000): Iterative methods for sparse linear systems. 2. ed. Philadelphia: SIAM. Saad, Y. (2000): Iterative methods for sparse linear systems. 2. ed. Philadelphia: SIAM.
25.
Zurück zum Zitat Takemoto, H., Mokhtari, P., Kato, H., Nishimura, R., Iida, K. (2012): Mechanism for generating peaks and notches of head-related transfer functions in the median plane. J. Acoust. Soc. Am., 132(6), 3832–3841. CrossRef Takemoto, H., Mokhtari, P., Kato, H., Nishimura, R., Iida, K. (2012): Mechanism for generating peaks and notches of head-related transfer functions in the median plane. J. Acoust. Soc. Am., 132(6), 3832–3841. CrossRef
26.
Zurück zum Zitat Treeby, B. E., Pan, J., Paurobally, R. M. (2007): An experimental study of the acoustic impedance characteristics of human hair. J. Acoust. Soc. Am., 122(4), 2107–2117. CrossRef Treeby, B. E., Pan, J., Paurobally, R. M. (2007): An experimental study of the acoustic impedance characteristics of human hair. J. Acoust. Soc. Am., 122(4), 2107–2117. CrossRef
27.
Zurück zum Zitat Ullman, S., Brenner, S. (1979): The interpretation of structure from motion. Proc. R. Soc. Lond. B, Biol. Sci., 203(1153), 405–426. Publisher: Royal Society. CrossRef Ullman, S., Brenner, S. (1979): The interpretation of structure from motion. Proc. R. Soc. Lond. B, Biol. Sci., 203(1153), 405–426. Publisher: Royal Society. CrossRef
28.
Zurück zum Zitat Vorländer, M. (2008): Auralization: fundamentals of acoustics, modelling, simulation, algorithms and acoustic virtual reality. Vorländer, M. (2008): Auralization: fundamentals of acoustics, modelling, simulation, algorithms and acoustic virtual reality.
29.
Zurück zum Zitat Wright, D., Hebrank, J. H., Wilson, B. (1974): Pinna reflections as cues for localization. J. Acoust. Soc. Am., 56(3), 957–962. CrossRef Wright, D., Hebrank, J. H., Wilson, B. (1974): Pinna reflections as cues for localization. J. Acoust. Soc. Am., 56(3), 957–962. CrossRef
30.
Zurück zum Zitat Xie, B. (2013): Head-related transfer function and virtual auditory display. Plantation: J. Ross Publishing. Xie, B. (2013): Head-related transfer function and virtual auditory display. Plantation: J. Ross Publishing.
32.
Zurück zum Zitat Ziegelwanger, H., Majdak, P., Kreuzer, W. (2015): Numerical calculation of listener-specific head-related transfer functions and sound localization: microphone model and mesh discretization. J. Acoust. Soc. Am., 138(1), 208–222. CrossRef Ziegelwanger, H., Majdak, P., Kreuzer, W. (2015): Numerical calculation of listener-specific head-related transfer functions and sound localization: microphone model and mesh discretization. J. Acoust. Soc. Am., 138(1), 208–222. CrossRef
33.
Zurück zum Zitat Ziegelwanger, H., Reichinger, A., Majdak, P. (2013): Calculation of listener-specific head-related transfer functions: effect of mesh quality. In Proceedings of meetings on acoustics (Bd. 19, S. 050017). Montreal: ASA. Ziegelwanger, H., Reichinger, A., Majdak, P. (2013): Calculation of listener-specific head-related transfer functions: effect of mesh quality. In Proceedings of meetings on acoustics (Bd. 19, S. 050017). Montreal: ASA.
Metadaten
Titel
Von Fotos zu personalisierter räumlicher Audiowiedergabe
verfasst von
Katharina Pollack
Fabian Brinkmann
Piotr Majdak
Wolfgang Kreuzer
Publikationsdatum
04.05.2021
Verlag
Springer Vienna
Erschienen in
e+i Elektrotechnik und Informationstechnik / Ausgabe 3/2021
Print ISSN: 0932-383X
Elektronische ISSN: 1613-7620
DOI
https://doi.org/10.1007/s00502-021-00891-4

Weitere Artikel der Ausgabe 3/2021

e & i Elektrotechnik und Informationstechnik 3/2021 Zur Ausgabe

Neuer Inhalt