Skip to main content
Top

2020 | OriginalPaper | Chapter

4. Psychoacoustics

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Abstract

Auditory perception is the mental representation of the acoustical outside world. Psychoacoustics describes characteristics of auditory perception and relates them to the physics of the sound field. This chapter discusses psychoacoustical foundations that play a role in spatial audio. For psychoacoustic sound field synthesis these are critical bands and masking, source localization and principles of auditory scene analysis. Their resolution, limitations, thresholds and just noticeable differences can be leveraged to present the necessary information for a desired listening experience with the precision needed for a natural, spatial listening experience.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Footnotes
1
Mainly based on Zwicker and Fastl (1999).
 
2
This formula can be found, e.g., in Terhardt et al. (1982), p. 682, Lin and Abdulla (2015), p. 24 and Kostek (2005), p. 10.
 
3
See Ashihara (2007) for an overview of experiments.
 
4
See Bruhn (2002a), pp. 667ff and Zwicker and Fastl (1999), pp. 175ff.
 
5
See also Zwicker and Fastl (1999), pp. 83f, Middlebrooks and Green (1991), pp. 150f and Grantham (1986), and Sect. 4.3.
 
6
See e.g. Bruhn (2002a), p. 669.
 
7
See e.g. Bader (2013), p. 325.
 
8
The experiment is described in detail in Ziemer et al. (2007).
 
9
Cf. Zwicker and Fastl (1999), p. 293.
 
10
See Bader (2013), p. 324.
 
11
These data are given in Zwicker and Fastl (1999), pp. 188–191.
 
12
See Klinke (1970) p. 318.
 
13
See e.g. Luce (1993), p. 74, and Schneider (2018), p. 618. The effect is illustrated in Fig. 4.6.
 
14
As discussed in Thurlow (1971), p. 230, and in Sect. 3.​2.​2.
 
15
See Hellbrück (1993), pp. 101ff.
 
16
Cf. Zwicker and Fastl (1999), p. 159.
 
17
See also Blauert (1974), p. 173, Allen (2008), pp. 28ff and Kostek (2005), p. 9.
 
18
See Gelfand (1990), p. 353.
 
19
According to Gelfand (1990) or, respectively Fastl (1977), p. 317.
 
20
See Gelfand (1990), pp. 406f.
 
21
See e.g. Zwicker and Fastl (1999), p. 33. An examination of nonlinearities in the auditory system and roughness can be found e.g. in Zwicker and Fastl (1999), pp. 50ff and 257ff.
 
22
See Gelfand (1990), p. 356.
 
23
See Zwicker, p. 82. According to Gelfand (1990), pre-masking effects up to 100 ms were observed, see Gelfand (1990), p. 374.
 
24
According to Brandter (2007), p. 126.
 
25
See Brandter (2007), p. 125.
 
26
Cf. Brandter (2007), p. 120.
 
27
Cf. Brandter (2007), p. 120.
 
28
Discussed in detail in Fastl (1977), Fastl (1979) and Gelfand (1990), p. 375.
 
29
See Gelfand (1990), pp. 369f.
 
30
See Blauert (1974) and Blauert (1985), translated in Blauert (1997).
 
31
See Blauert (1997), p. 409.
 
32
See Bruhn (2002b), p. 444, definitions of bottom-up- and top-down-processing see e.g. Myers (2008), p. 214.
 
33
See e.g. Webers (2003), p. 120.
 
34
See Webers (2003), p. 120.
 
35
See Kling and Riggs (1971), p. 351 and Blauert (1997), p. 360.
 
36
See Myers (2008), p. 240, Zwicker and Fastl (1999), pp. 293f and Kling and Riggs (1971), p. 355.
 
37
See Kling and Riggs (1971), p. 351.
 
38
See Kling and Riggs (1971), p. 352.
 
39
See Larcher and Jot (1999).
 
40
See e.g. Kling and Riggs (1971), pp. 350ff and Morikawa and Hirashara (2010), p. 419.
 
41
As discussed in Sect. 3.​2.​2, see also Hall (2008), p. 343, Davis (2007), p. 750 and Ross et al. (2007).
 
42
See e.g. Middlebrooks and Green (1991), pp. 142f.
 
43
See Morikawa and Hirashara (2010), p. 419.
 
44
The so-called “duplex theory”, see e.g. Bruhn and Michel (2002), p. 651.
 
45
See Martens (1987) and Sodnik et al. (2006).
 
46
See Middlebrooks and Green (1991), p. 145.
 
47
See Verheijen (1997), p. 8.
 
48
Detailed information on the inverse distance law which describes the sound pressure decay is given in Sect. 5.​1.​6. Details on contours of equal loudness can be found e.g. in Zwicker and Fastl (1999), pp. 203ff.
 
49
See e.g. Strube (1985), p. 69.
 
50
See Theile (1980) and Bregman (1990).
 
51
See David jr. (1988), p. 159, Friedrich (2008), p. 39, Hall (2008), p. 469 and Blauert (1997), p. 411.
 
52
See e.g. Dickreiter (1978), p. 77 and Friesecke (2007), p. 139.
 
53
See e.g. Blauert (1974), p. 180 or Strube (1985), p. 68.
 
54
According to Blauert (1974), p. 224.
 
55
See Zurek and Saberi (2003).
 
56
Particularly based on Bregman (1990).
 
57
See Bregman (1990), pp. 38f, 137, 204, 395, and 451.
 
58
This section gives an overview of grouping principles. However, a broader overview concerning factors influencing sequential streaming is given in Moore and Gockel (2002).
 
59
See Bregman (1990), p. 72.
 
60
Bregman (1990), p. 450.
 
61
Bregman (1990), p. 130.
 
62
See Bregman (1990), p. 204.
 
63
Bregman (1990), p. 236.
 
64
Referred to as “Körte’s law”, see Bregman (1990), p. 22.
 
65
Bregman (1990), p. 21.
 
66
See Bregman (1990), p. 76, 90, and 93.
 
67
See Bregman (1990), p. 447.
 
68
See e.g. Cariani and Micheyl (2012), p. 360.
 
69
See e.g. Bregman (1990), p. 183 or Schmidhuber et al. (2011).
 
70
See e.g. Bregman (1990), p. 405.
 
71
See Werner (2012), pp. 4ff.
 
72
See Bregman (1990), p. 136.
 
73
See Garner (1974), p. 10.
 
74
See Bregman (1990), p. 165.
 
75
See Bregman (1990), pp. 305f.
 
76
This gestalt quality is known as “Übersummenhaftigkeit”, see von Ehrenfels (1890), pp. 249ff.
 
77
See Bregman (1990), p. 172.
 
78
See Bregman (1990), p. 140.
 
79
See Bregman (1990), p. 475.
 
80
See Theile (1980), especially p. 24.
 
81
See Ono et al. (2002), p. 2 and Theile (1980), p. 12. Details on the comb filter effect in stereo playback are given in Sect. 7.​2.​2.
 
82
See Bregman (1990), p. 693.
 
83
Concepts, algorithms and the state of research are extensively illuminated in Rosenthal and Okuno (1998) and Wang and Brown (2006).
 
84
See Bregman (1990), pp. 183f.
 
85
See McGurk and McDonald (1976).
 
86
See e.g. Donnadieu (2007), p. 305.
 
87
See Donnadieu (2007), pp. 305f.
 
88
See Bregman (1990), pp. 256ff.
 
89
See Shepard (1964), Burns (1981) and Leman (1995), pp. 23ff for details on pitch perception and the Shepard illusion.
 
90
Ziemer and Schultheis (2018a), Ziemer et al. (2018) and Ziemer and Schultheis (2018b) explain how the Shepard tone is created and how it is perceived by passive listeners and in an interactive task.
 
91
See Bregman (1990), pp. 496ff, 677f, 457f and p. 464.
 
92
See Bregman (1990), p. 457.
 
93
See Bader (2013), pp. 632ff.
 
94
See e.g. Lerch (2008), pp. 872ff. Extensive discussion about MP3 can be found in Ruckert (2005).
 
95
See e.g. Blauert (2008), Fastl (2010) and Spors et al. (2013).
 
Literature
go back to reference Blauert J (1974) Räumliches Hören. Hirzel, Stuttgart Blauert J (1974) Räumliches Hören. Hirzel, Stuttgart
go back to reference Blauert J (1985) Räumliches Hören. Nachschrift-Neue Ergebnisse und Trends seit 1972. Hirzel, Stuttgart Blauert J (1985) Räumliches Hören. Nachschrift-Neue Ergebnisse und Trends seit 1972. Hirzel, Stuttgart
go back to reference Blauert J (1997) Spatial hearing. The pychophysics of human sound source localization, revised edn. MIT Press, Cambridge Blauert J (1997) Spatial hearing. The pychophysics of human sound source localization, revised edn. MIT Press, Cambridge
go back to reference Blauert J (2008) 3-d-Lautsprecher-Wiedergabemethoden. In: Fortschritte der Akustik—DAGA’08. Dresden, Mar 2008, pp 25–26 Blauert J (2008) 3-d-Lautsprecher-Wiedergabemethoden. In: Fortschritte der Akustik—DAGA’08. Dresden, Mar 2008, pp 25–26
go back to reference Brandter C (2007) Ein systematischer Ansatz zur Evaluation von Lautheitsmodellen. Uni-Edition, Berlin Brandter C (2007) Ein systematischer Ansatz zur Evaluation von Lautheitsmodellen. Uni-Edition, Berlin
go back to reference Bruhn H (2002a) Verarbeitung einzelner Schallereignisse. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch, 4th edn. Rowohlt, Reinbek bei Hamburg, pp 666–670 Bruhn H (2002a) Verarbeitung einzelner Schallereignisse. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch, 4th edn. Rowohlt, Reinbek bei Hamburg, pp 666–670
go back to reference Bruhn H. (2002b) Tonpsychologie—Gehörpsychologie—Musikpsychologie. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch, 4th edn. Rowohlt, Reinbek bei Hamburg, pp 439–451 Bruhn H. (2002b) Tonpsychologie—Gehörpsychologie—Musikpsychologie. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch, 4th edn. Rowohlt, Reinbek bei Hamburg, pp 439–451
go back to reference Bruhn H, Michel D (2002) Hören im Raum. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch, 4th edn. Rowohlt, Reinbek bei Hamburg, pp 650–655 Bruhn H, Michel D (2002) Hören im Raum. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch, 4th edn. Rowohlt, Reinbek bei Hamburg, pp 650–655
go back to reference David EE Jr (1988) Aufzeichnung und Wiedergabe von Klängen. In: Winkler K (ed) Die Physik der Musikinstrumente. Spektrum der Wissenschaft, Heidelberg, pp 150–160 David EE Jr (1988) Aufzeichnung und Wiedergabe von Klängen. In: Winkler K (ed) Die Physik der Musikinstrumente. Spektrum der Wissenschaft, Heidelberg, pp 150–160
go back to reference Dickreiter M (1978) Handbuch der Tonstudiotechnik, vol 1, 2nd edn. In: De Gruyter M et al Dickreiter M (1978) Handbuch der Tonstudiotechnik, vol 1, 2nd edn. In: De Gruyter M et al
go back to reference Dickreiter M (1987) Handbuch der Tonstudiotechnik, vol 1, 5 völlig neu bearbeitete und ergänzte edition. In: De Gruyter M, et al Dickreiter M (1987) Handbuch der Tonstudiotechnik, vol 1, 5 völlig neu bearbeitete und ergänzte edition. In: De Gruyter M, et al
go back to reference Fastl H (2010) Praktische Anwendungen der Psychoakustik. In: Fortschritte der Akustik—DAGA’10. Berlin, pp 5–10 Fastl H (2010) Praktische Anwendungen der Psychoakustik. In: Fortschritte der Akustik—DAGA’10. Berlin, pp 5–10
go back to reference Friedrich H (2008) Tontechnik für Mediengestalter. Töne hören—Technik verstehen—Medien gestalten. Springer, Berlin Friedrich H (2008) Tontechnik für Mediengestalter. Töne hören—Technik verstehen—Medien gestalten. Springer, Berlin
go back to reference Friesecke A (2007) Die Audio-Enzyklopädie. Ein Nachschlagewerk für Tontechniker, K G Saur, Munich Friesecke A (2007) Die Audio-Enzyklopädie. Ein Nachschlagewerk für Tontechniker, K G Saur, Munich
go back to reference Garner WR (1974) The processing of information and structure. Lawrence Erlbaum, New York Garner WR (1974) The processing of information and structure. Lawrence Erlbaum, New York
go back to reference Gelfand SA (1990) Hearing. An introduction to psychological and physiological acoustics, 2nd edn. Informa. New York and Basel Gelfand SA (1990) Hearing. An introduction to psychological and physiological acoustics, 2nd edn. Informa. New York and Basel
go back to reference Hall DE (2008) Musikalische Akustik. Ein Handbuch, Schott, Mainz Hall DE (2008) Musikalische Akustik. Ein Handbuch, Schott, Mainz
go back to reference Haustein BG, Schirmer W (1970) Messeinrichtung zur Untersuchung des Richtungslokalisationsvermögens. Hochfrequenztechnik und Elektroakustik 79:96–101 Haustein BG, Schirmer W (1970) Messeinrichtung zur Untersuchung des Richtungslokalisationsvermögens. Hochfrequenztechnik und Elektroakustik 79:96–101
go back to reference Hellbrück J (1993) Hören. Physiologie, Psychologie und Pathologie. Hogrefe, Göttingen Hellbrück J (1993) Hören. Physiologie, Psychologie und Pathologie. Hogrefe, Göttingen
go back to reference Kling JW, Riggs LA (eds) (1971) Woodworth & Schlossberg’s experimental psychology, 3 edn. Holt, Rinehart and Winston, New York Kling JW, Riggs LA (eds) (1971) Woodworth & Schlossberg’s experimental psychology, 3 edn. Holt, Rinehart and Winston, New York
go back to reference Larcher V, Jot J-M (1999) Techniques d’interpolation de filtres audio-numériques. application á la reproduction spatiale des sons sur écouteurs. In: Congrès Français d’Acoustique, Marseille, France, Marseille Larcher V, Jot J-M (1999) Techniques d’interpolation de filtres audio-numériques. application á la reproduction spatiale des sons sur écouteurs. In: Congrès Français d’Acoustique, Marseille, France, Marseille
go back to reference Leman M (1995) Music and Schema theory. Cognitive foundations of systematic musicology. Springer, BerlinCrossRef Leman M (1995) Music and Schema theory. Cognitive foundations of systematic musicology. Springer, BerlinCrossRef
go back to reference Martens WL (1987) Principal components analysis and resynthesis of spectral cues to perceived directions. In: Proceedings of the international computer music conference. San Francisco, pp 274–281 Martens WL (1987) Principal components analysis and resynthesis of spectral cues to perceived directions. In: Proceedings of the international computer music conference. San Francisco, pp 274–281
go back to reference Morikawa D, Hirashara T (2010) Signal frequency necessary for horizontal sound localization. Acoust Sci Tech 31(6):417–419CrossRef Morikawa D, Hirashara T (2010) Signal frequency necessary for horizontal sound localization. Acoust Sci Tech 31(6):417–419CrossRef
go back to reference Ono K, Pulkki V, Karjalainen M (2002) Binaural modeling of multiple sound source perception. coloration of wideband sound. In: Audio engineering society convention 112, Munich, May 2002 Ono K, Pulkki V, Karjalainen M (2002) Binaural modeling of multiple sound source perception. coloration of wideband sound. In: Audio engineering society convention 112, Munich, May 2002
go back to reference Preibisch-Effenberger R (1966) Die Schallokalisationsfähigkeit des Menschen und ihre Audioetaudiom Verwendung zur klinischen Diagnostik. PhD thesis, Technical University of Dresden, Dresden Preibisch-Effenberger R (1966) Die Schallokalisationsfähigkeit des Menschen und ihre Audioetaudiom Verwendung zur klinischen Diagnostik. PhD thesis, Technical University of Dresden, Dresden
go back to reference Rosenthal DF, Okuno HG (1998) Computational auditory scene analysis. Lawrence Erlbaum, Mahwah Rosenthal DF, Okuno HG (1998) Computational auditory scene analysis. Lawrence Erlbaum, Mahwah
go back to reference Ruckert M (2005) Understanding MP3. Syntax, semantics, mathematics and algorithms. GWV, Wiesbaden Ruckert M (2005) Understanding MP3. Syntax, semantics, mathematics and algorithms. GWV, Wiesbaden
go back to reference Schmidhuber M, Völk F, Fastl H (2011) Psychoakustische Experimente zum Einfluss des Ventriloquismuseffekts auf Richtungsunterschiedsschwellen (minimum audible angles) in der Horizontalebene. In: Fortschritte der Akustik—DAGA’11. Düsseldorf, pp 577–578 Schmidhuber M, Völk F, Fastl H (2011) Psychoakustische Experimente zum Einfluss des Ventriloquismuseffekts auf Richtungsunterschiedsschwellen (minimum audible angles) in der Horizontalebene. In: Fortschritte der Akustik—DAGA’11. Düsseldorf, pp 577–578
go back to reference Strube G (1985) Lokalisation von Schallereignissen. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch in Schlüsselbegriffen. Urban & Schwarzenberg, Munich, pp 65–69 Strube G (1985) Lokalisation von Schallereignissen. In: Bruhn H, Oerter R, Rösing H (eds) Musikpsychologie. Ein Handbuch in Schlüsselbegriffen. Urban & Schwarzenberg, Munich, pp 65–69
go back to reference Theile G (1980) Über die Lokalisation im überlagerten Schallfeld. PhD thesis, University of Technology Berlin Theile G (1980) Über die Lokalisation im überlagerten Schallfeld. PhD thesis, University of Technology Berlin
go back to reference Thurlow WR (1971) Audition. In: Kling JW, Riggs LA (eds) Woodworth & Schlosberg’s experimental psychology, Third American edition. London, pp 223–271 Thurlow WR (1971) Audition. In: Kling JW, Riggs LA (eds) Woodworth & Schlosberg’s experimental psychology, Third American edition. London, pp 223–271
go back to reference Verheijen, E (1997) Sound reproduction by wave field synthesis. PhD thesis, Delft University of Technology, Delft Verheijen, E (1997) Sound reproduction by wave field synthesis. PhD thesis, Delft University of Technology, Delft
go back to reference Webers J (2003) Handbuch der Tonstudiotechnik. Analoges und Digitales Audio Recording bei Fernsehen, Film und Rundfunk. Franzis, Poing, 8. neu bearbeitete edition Webers J (2003) Handbuch der Tonstudiotechnik. Analoges und Digitales Audio Recording bei Fernsehen, Film und Rundfunk. Franzis, Poing, 8. neu bearbeitete edition
Metadata
Title
Psychoacoustics
Author
Tim Ziemer
Copyright Year
2020
DOI
https://doi.org/10.1007/978-3-030-23033-3_4

Premium Partners