Skip to main content

2024 | OriginalPaper | Buchkapitel

Räumliche Manipulation von musikalischem Klang: Informierte Quellentrennung und Neuverräumlichung

verfasst von : Sylvain Marchand

Erschienen in: Computergestützte Archivierung von Tonträgern

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

„Aktives Hören“ ermöglicht es dem Hörer, mit dem Klang zu interagieren, während er gespielt wird, wie die Komponisten elektroakustischer Musik. Die wichtigste Manipulation der musikalischen Szene ist die (Neu-)Verräumlichung: das Verschieben von Klangquellen im Raum. Dies ist gleichbedeutend mit der Trennung der Quellen. Wenn man alle Quellen der Szene bis auf eine vom Hörer wegbewegt, wird diese Quelle tatsächlich getrennt. Und es ist einfach, getrennte Quellen zu bewegen und daraus die entsprechende Szene (räumliches Bild) zu erstellen. Diese räumliche Interaktion/Quellentrennung von festen Musikstücken in ausreichender Qualität zu ermöglichen, ist eine (zu) schwierige Aufgabe für klassische Ansätze, da sie eine Analyse der Szene mit unvermeidlichen (und oft inakzeptablen) Schätzfehlern erfordert. Daher haben wir den informierten Ansatz eingeführt, der darin besteht, einige zusätzliche Informationen unhörbar einzubetten. Diese Informationen, die mit einer minimalen Rate kodiert werden, zielen darauf ab, die Präzision der Analyse/Trennung zu erhöhen. Der informierte Ansatz stützt sich also sowohl auf Schätzungen als auch auf Informationstheorien. Im Rahmen des DReaM-Projekts wurden mehrere Methoden der informierten Quellentrennung (ISS) vorgeschlagen. Zu den besten Methoden gehört die auf räumlicher Filterung (Beamforming) basierende Methode, bei der die spektralen Einhüllenden der Quellen (perzeptiv kodiert) als zusätzliche Information verwendet werden. Genauer gesagt, wird die vorgeschlagene Methode in einem Encoder-Decoder-Rahmen realisiert. Im Kodierer werden die spektralen Einhüllenden der (bekannten) Originalquellen extrahiert, ihre Frequenzauflösung wird an die kritischen Bänder angepasst und ihr Betrag logarithmisch quantisiert. Diese Hüllkurven werden dann zusammen mit der Stereomischung an den Decoder weitergeleitet. Im Decoder wird das Mischsignal durch zeit- und frequenzselektive räumliche Filterung zerlegt, die durch einen aus den spektralen Hüllkurvenwerten abgeleiteten Quellenaktivitätsindex gesteuert wird. Die Manipulation der Klangquellen in Echtzeit ist dann möglich, ausgehend von ursprünglich fixierten Musikstücken (möglicherweise auf bestimmten Medien wie CDs) und mit einer unvorhergesehenen (kontrollierbaren) Qualität.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
Literatur
1.
Zurück zum Zitat Comon P, Jutten C (Hrsg) (2010) Handbook of blind source separation – independent component analysis and applications. Academic Press, Oxford Comon P, Jutten C (Hrsg) (2010) Handbook of blind source separation – independent component analysis and applications. Academic Press, Oxford
2.
Zurück zum Zitat Fourer D, Marchand S (2013) Informed spectral analysis: audio signal parameter estimation using side information. EURASIP J Appl Signal Process 1:178CrossRef Fourer D, Marchand S (2013) Informed spectral analysis: audio signal parameter estimation using side information. EURASIP J Appl Signal Process 1:178CrossRef
3.
Zurück zum Zitat Girin L, Pinel J (2011) Informed audio source separation from compressed linear stereo mixtures. In: Proceedings of the 42nd AES conference, Ilmenau, Germany, July 2011 Girin L, Pinel J (2011) Informed audio source separation from compressed linear stereo mixtures. In: Proceedings of the 42nd AES conference, Ilmenau, Germany, July 2011
4.
Zurück zum Zitat Gorlow S, Marchand S (2013) Informed audio source separation using linearly constrained spatial filters. IEEE Trans Audio Speech Lang Process 21(1):3–13CrossRef Gorlow S, Marchand S (2013) Informed audio source separation using linearly constrained spatial filters. IEEE Trans Audio Speech Lang Process 21(1):3–13CrossRef
5.
Zurück zum Zitat Gorlow S, Marchand S (2013) Informed separation of spatial images of stereo music recordings using low-order statistics. In: Proceedings of the IEEE workshop on machine learning for signal processing (MLSP), Southampton, United Kingdom, September 2013 Gorlow S, Marchand S (2013) Informed separation of spatial images of stereo music recordings using low-order statistics. In: Proceedings of the IEEE workshop on machine learning for signal processing (MLSP), Southampton, United Kingdom, September 2013
6.
Zurück zum Zitat Gorlow S, Marchand S (2013) On the informed source separation approach for interactive remixing in stereo. In: Proceedings of the 134th AES convention, Roma, Italy, May 2013 Gorlow S, Marchand S (2013) On the informed source separation approach for interactive remixing in stereo. In: Proceedings of the 134th AES convention, Roma, Italy, May 2013
7.
Zurück zum Zitat Gunawan D, Sen D (2010) Iterative phase estimation for the synthesis of separated sources from single-channel mixtures. IEEE Signal Process Lett 17(5):421–424CrossRef Gunawan D, Sen D (2010) Iterative phase estimation for the synthesis of separated sources from single-channel mixtures. IEEE Signal Process Lett 17(5):421–424CrossRef
8.
Zurück zum Zitat Huber R, Kollmeier B (2006) PEMO-Q – a new method for objective audio quality assessment using a model of auditory perception. IEEE Trans Audio Speech Lang Process 14(6):1902–1911CrossRef Huber R, Kollmeier B (2006) PEMO-Q – a new method for objective audio quality assessment using a model of auditory perception. IEEE Trans Audio Speech Lang Process 14(6):1902–1911CrossRef
9.
Zurück zum Zitat ISO/IEC 23000-12 (2010) Information technology – multimedia application format (MPEG-A) – Part 12: Interactive music application format (IMAF) ISO/IEC 23000-12 (2010) Information technology – multimedia application format (MPEG-A) – Part 12: Interactive music application format (IMAF)
10.
Zurück zum Zitat Knuth KH (2005) Informed source separation: a Bayesian tutorial. In: Proceedings of the European signal processing conference (EUSIPCO), Antalya, Turkey, September 2005 Knuth KH (2005) Informed source separation: a Bayesian tutorial. In: Proceedings of the European signal processing conference (EUSIPCO), Antalya, Turkey, September 2005
11.
Zurück zum Zitat Lepain P (1998) Recherche et applications en informatique musicale, chapter Écoute interactive des documents musicaux numériques, pp 209–226, Hermes, Paris, France, 1998 (in French) Lepain P (1998) Recherche et applications en informatique musicale, chapter Écoute interactive des documents musicaux numériques, pp 209–226, Hermes, Paris, France, 1998 (in French)
12.
Zurück zum Zitat Liutkus A, Gorlow S, Sturmel N, Zhang S, Girin L, Badeau R, Daudet L, Marchand S, Richard G (2012) Informed audio source separation: a comparative study. In: Proceedings of the European signal processing conference (EUSIPCO), Bucharest, Romania, August 2012 Liutkus A, Gorlow S, Sturmel N, Zhang S, Girin L, Badeau R, Daudet L, Marchand S, Richard G (2012) Informed audio source separation: a comparative study. In: Proceedings of the European signal processing conference (EUSIPCO), Bucharest, Romania, August 2012
13.
Zurück zum Zitat Liutkus A, Ozerov A, Badeau R, Richard G (2012) Spatial coding-based informed source separation. In: Proceedings of the European signal processing conference (EUSIPCO), Bucharest, Romania, August 2012 Liutkus A, Ozerov A, Badeau R, Richard G (2012) Spatial coding-based informed source separation. In: Proceedings of the European signal processing conference (EUSIPCO), Bucharest, Romania, August 2012
14.
Zurück zum Zitat Liutkus A, Pinel J, Badeau R, Girin L, Richard G (2012) Informed source separation through spectrogram coding and data embedding. Signal Process 92(8):1937–1949CrossRef Liutkus A, Pinel J, Badeau R, Girin L, Richard G (2012) Informed source separation through spectrogram coding and data embedding. Signal Process 92(8):1937–1949CrossRef
15.
Zurück zum Zitat Marchand S, Mansencal B, Girin L (2011) Interactive music with active audio CDs. Lect Notes Comput Sci Explor Music Contents 6684:31–50CrossRef Marchand S, Mansencal B, Girin L (2011) Interactive music with active audio CDs. Lect Notes Comput Sci Explor Music Contents 6684:31–50CrossRef
16.
Zurück zum Zitat Marchand S, Badeau R, Baras C, Daudet L, Fourer D, Girin L, Gorlow S, Liutkus A, Pinel J, Richard G, Sturmel N, Zang S (2012) DReaM: a novel system for joint source separation and multi-track coding. In: Proceedings of the 133rd AES convention, San Francisco, California, USA, October 2012 Marchand S, Badeau R, Baras C, Daudet L, Fourer D, Girin L, Gorlow S, Liutkus A, Pinel J, Richard G, Sturmel N, Zang S (2012) DReaM: a novel system for joint source separation and multi-track coding. In: Proceedings of the 133rd AES convention, San Francisco, California, USA, October 2012
17.
Zurück zum Zitat Mouba J, Marchand S, Mansencal B, Rivet J-M (2008) RetroSpat: a perception-based system for semi-automatic diffusion of acousmatic music. In: Proceedings of the sound and music computing (SMC) conference, Berlin, Germany, July/August 2008, S 33–40 Mouba J, Marchand S, Mansencal B, Rivet J-M (2008) RetroSpat: a perception-based system for semi-automatic diffusion of acousmatic music. In: Proceedings of the sound and music computing (SMC) conference, Berlin, Germany, July/August 2008, S 33–40
18.
Zurück zum Zitat Ozerov A, Févotte C (2010) Multichannel nonnegative matrix factorization in convolutive mixtures for audio source separation. IEEE Trans Audio Speech Lang Process 18(3):550–563CrossRef Ozerov A, Févotte C (2010) Multichannel nonnegative matrix factorization in convolutive mixtures for audio source separation. IEEE Trans Audio Speech Lang Process 18(3):550–563CrossRef
19.
Zurück zum Zitat Ozerov A, Liutkus A, Badeau R, Richard G (2011) Informed source separation: source coding meets source separation. In: Proceedings of the IEEE workshop on applications of signal processing to audio and acoustics (WASPAA), New Paltz, New York, USA, October 2011, S 257–260 Ozerov A, Liutkus A, Badeau R, Richard G (2011) Informed source separation: source coding meets source separation. In: Proceedings of the IEEE workshop on applications of signal processing to audio and acoustics (WASPAA), New Paltz, New York, USA, October 2011, S 257–260
20.
Zurück zum Zitat Pachet F, Delerue O (1998) A constraint-based temporal music spatializer. In: Proceedings of the ACM multimedia conference, Brighton, United Kingdom Pachet F, Delerue O (1998) A constraint-based temporal music spatializer. In: Proceedings of the ACM multimedia conference, Brighton, United Kingdom
21.
Zurück zum Zitat Parvaix M, Girin L (2011) Informed source separation of linear instantaneous under-determined audio mixtures by source index embedding. IEEE Trans Audio Speech Lang Process 19(6):1721–1733CrossRef Parvaix M, Girin L (2011) Informed source separation of linear instantaneous under-determined audio mixtures by source index embedding. IEEE Trans Audio Speech Lang Process 19(6):1721–1733CrossRef
22.
Zurück zum Zitat Pinel J, Girin L, Baras C, Parvaix M (2010) A high-capacity watermarking technique for audio signals based on MDCT-domain quantization. In: Proceedings of the international congress on acoustics (ICA), Sydney, Australia, August 2010 Pinel J, Girin L, Baras C, Parvaix M (2010) A high-capacity watermarking technique for audio signals based on MDCT-domain quantization. In: Proceedings of the international congress on acoustics (ICA), Sydney, Australia, August 2010
23.
Zurück zum Zitat Sturmel N, Daudet L (2013) Informed source separation using iterative reconstruction. IEEE Trans Audio Speech Lang Process 21(1):178–185CrossRef Sturmel N, Daudet L (2013) Informed source separation using iterative reconstruction. IEEE Trans Audio Speech Lang Process 21(1):178–185CrossRef
24.
Zurück zum Zitat Sturmel N, Liutkus A, Pinel J, Girin L, Marchand S, Richard G, Badeau R, Daudet L (2012) Linear mixing models for active listening of music productions in realistic studio conditions. In: Proceedings of the 132nd AES convention, Budapest, Hungary, April 2012 Sturmel N, Liutkus A, Pinel J, Girin L, Marchand S, Richard G, Badeau R, Daudet L (2012) Linear mixing models for active listening of music productions in realistic studio conditions. In: Proceedings of the 132nd AES convention, Budapest, Hungary, April 2012
25.
Zurück zum Zitat Vincent E, Gribonval R, Févotte C (2006) Performance measurement in blind audio source separation. IEEE Trans Audio Speech Lang Process 14(4):1462–1469CrossRef Vincent E, Gribonval R, Févotte C (2006) Performance measurement in blind audio source separation. IEEE Trans Audio Speech Lang Process 14(4):1462–1469CrossRef
Metadaten
Titel
Räumliche Manipulation von musikalischem Klang: Informierte Quellentrennung und Neuverräumlichung
verfasst von
Sylvain Marchand
Copyright-Jahr
2024
DOI
https://doi.org/10.1007/978-3-031-49640-0_8