Skip to main content

2017 | OriginalPaper | Buchkapitel

3. Principles of Entropy Coding with Perceptual Quality Evaluation

verfasst von : Tom Bäckström

Erschienen in: Speech Coding

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The objective of speech coding is to transmit speech at the highest possible quality with the lowest possible amount of resources. To achieve the best compromise, we can use available information about 1. the source, which is the speech production system, 2. the quality measure or evaluation criteria, which depends on the performance of the human hearing system and 3. the statistical frequency and distribution of the involved parameters. By developing models for all such information, we can optimise the system to perform efficiently. In practice, the three methods are overlapping in the sense that it is often difficult to make a clear-cut separation between them. While source modelling was already discussed in Chap. 2, this chapter reviews entropy coding methods and the associated perceptual modelling methods.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Anhänge
Nur mit Berechtigung zugänglich
Literatur
1.
Zurück zum Zitat Bazaraa, M.S., Sherali, H.D., Shetty, C.M.: Nonlinear Programming: Theory and Algorithms. Wiley, New Jersey (2013)MATH Bazaraa, M.S., Sherali, H.D., Shetty, C.M.: Nonlinear Programming: Theory and Algorithms. Wiley, New Jersey (2013)MATH
2.
Zurück zum Zitat Bosi, M., Goldberg, R.E.: Introduction to Digital Audio Coding and Standards. Kluwer Academic Publishers, Dordrecht (2003)CrossRef Bosi, M., Goldberg, R.E.: Introduction to Digital Audio Coding and Standards. Kluwer Academic Publishers, Dordrecht (2003)CrossRef
3.
Zurück zum Zitat Bäckström, T.: Vandermonde factorization of Toeplitz matrices and applications in filtering and warping. IEEE Trans. Signal Process. 61(24), 6257–6263 (2013)MathSciNetCrossRef Bäckström, T.: Vandermonde factorization of Toeplitz matrices and applications in filtering and warping. IEEE Trans. Signal Process. 61(24), 6257–6263 (2013)MathSciNetCrossRef
4.
Zurück zum Zitat Bäckström, T., Helmrich, C.R.: Decorrelated innovative codebooks for ACELP using factorization of autocorrelation matrix. In: Proceedings of the Interspeech, pp. 2794–2798 (2014) Bäckström, T., Helmrich, C.R.: Decorrelated innovative codebooks for ACELP using factorization of autocorrelation matrix. In: Proceedings of the Interspeech, pp. 2794–2798 (2014)
5.
Zurück zum Zitat Edler, B.: Coding of audio signals with overlapping block transform and adaptive window functions. Frequenz 43(9), 252–256 (1989)CrossRef Edler, B.: Coding of audio signals with overlapping block transform and adaptive window functions. Frequenz 43(9), 252–256 (1989)CrossRef
6.
Zurück zum Zitat Gersho, A., Gray, R.M.: Vector Quantization and Signal Compression. Springer, New York (1992)MATHCrossRef Gersho, A., Gray, R.M.: Vector Quantization and Signal Compression. Springer, New York (1992)MATHCrossRef
7.
Zurück zum Zitat Gibson, J.D., Sayood, K.: Lattice quantization. Adv. Electron. Electron Phys. 72, 259–330 (1988)CrossRef Gibson, J.D., Sayood, K.: Lattice quantization. Adv. Electron. Electron Phys. 72, 259–330 (1988)CrossRef
8.
Zurück zum Zitat Golub, G.H., van Loan, C.F.: Matrix Computations, 3rd edn. John Hopkins University Press, Maryland (1996)MATH Golub, G.H., van Loan, C.F.: Matrix Computations, 3rd edn. John Hopkins University Press, Maryland (1996)MATH
9.
Zurück zum Zitat Gray, R.M., Neuhoff, D.L.: Quantization. IEEE Trans. Inf. Theory 44(6), 2325–2383 (1998)MATHCrossRef Gray, R.M., Neuhoff, D.L.: Quantization. IEEE Trans. Inf. Theory 44(6), 2325–2383 (1998)MATHCrossRef
10.
Zurück zum Zitat Jayant, N.S., Noll, P.: Digital Coding of Waveforms: Principles and Applications to Speech and Video. Englewood Cliffs, New Jersey (1984) Jayant, N.S., Noll, P.: Digital Coding of Waveforms: Principles and Applications to Speech and Video. Englewood Cliffs, New Jersey (1984)
11.
Zurück zum Zitat Mitra, S.K.: Digital Signal Processing: A Computer-Based Approach. McGraw-Hill, Boston (1998) Mitra, S.K.: Digital Signal Processing: A Computer-Based Approach. McGraw-Hill, Boston (1998)
12.
Zurück zum Zitat Pisoni, D., Remez, R.: The Handbook of Speech Perception. Wiley, New Jersey (2008) Pisoni, D., Remez, R.: The Handbook of Speech Perception. Wiley, New Jersey (2008)
13.
Zurück zum Zitat Rabiner, L.R., Schafer, R.W.: Digital Processing of Speech Signals. Prentice-Hall, Englewood Cliffs (1978) Rabiner, L.R., Schafer, R.W.: Digital Processing of Speech Signals. Prentice-Hall, Englewood Cliffs (1978)
14.
Zurück zum Zitat Sanchez, V.E., Adoul, J.-P.: Low-delay wideband speech coding using a new frequency domain approach. In: Proceedings of the ICASSP, vol. 2, pp. 415–418. IEEE (1993) Sanchez, V.E., Adoul, J.-P.: Low-delay wideband speech coding using a new frequency domain approach. In: Proceedings of the ICASSP, vol. 2, pp. 415–418. IEEE (1993)
15.
Zurück zum Zitat Shannon, C.E.: A mathematical theory of communication. ACM SIGMOBILE Mob. Comput. Commun. Rev. 5(1), 3–55 (2001)MathSciNetCrossRef Shannon, C.E.: A mathematical theory of communication. ACM SIGMOBILE Mob. Comput. Commun. Rev. 5(1), 3–55 (2001)MathSciNetCrossRef
Metadaten
Titel
Principles of Entropy Coding with Perceptual Quality Evaluation
verfasst von
Tom Bäckström
Copyright-Jahr
2017
DOI
https://doi.org/10.1007/978-3-319-50204-5_3

Neuer Inhalt