Skip to main content
Erschienen in:
Buchtitelbild

2021 | OriginalPaper | Buchkapitel

Audio Features, Precomputed for Podcast Retrieval and Information Access Experiments

verfasst von : Abigail Alexander, Matthijs Mars, Josh C. Tingey, Haoyue Yu, Chris Backhouse, Sravana Reddy, Jussi Karlgren

Erschienen in: Experimental IR Meets Multilinguality, Multimodality, and Interaction

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

This paper describes how an existing collection of podcast material has been enriched with precomputed audio features. The feature set which is described in the paper is made available to facilitate more convenient information access experimentation to collections that include both audio and text data. A simple example analysis is given to demonstrate how the audio features can be used to score podcast segments for being entertaining, discussion oriented, or subjective, to fit the current TREC Podcast Track task.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Alexander, A., Mars, M., Tingey, J., Yu, H.: Audio-enhanced segment retrieval within the Spotify podcasts dataset. Technical report, University College London (2021) Alexander, A., Mars, M., Tingey, J., Yu, H.: Audio-enhanced segment retrieval within the Spotify podcasts dataset. Technical report, University College London (2021)
2.
Zurück zum Zitat Clifton, A., et al.: 100,000 podcasts: a Spoken English document corpus. In: Proceedings of the 28th International Conference on Computational Linguistics (COLING) (2020) Clifton, A., et al.: 100,000 podcasts: a Spoken English document corpus. In: Proceedings of the 28th International Conference on Computational Linguistics (COLING) (2020)
3.
Zurück zum Zitat Devlin, J., Chang, M.W., Lee, K., Toutanova, K.: BERT: pre-training of deep bidirectional transformers for language understanding. In: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Association for Computational Linguistics (2019) Devlin, J., Chang, M.W., Lee, K., Toutanova, K.: BERT: pre-training of deep bidirectional transformers for language understanding. In: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Association for Computational Linguistics (2019)
4.
Zurück zum Zitat Eyben, F., et al.: The Geneva Minimalistic Acoustic Parameter Set (GeMAPS) for voice research and affective computing. IEEE Trans. Affect. Comput. 7(2), 190–202 (2016)CrossRef Eyben, F., et al.: The Geneva Minimalistic Acoustic Parameter Set (GeMAPS) for voice research and affective computing. IEEE Trans. Affect. Comput. 7(2), 190–202 (2016)CrossRef
5.
Zurück zum Zitat Eyben, F., Wöllmer, M., Schuller, B.: Opensmile: the Munich versatile and fast open-source audio feature extractor. In: Proceedings of the International Conference on Multimedia - MM 2010. ACM Press (2010) Eyben, F., Wöllmer, M., Schuller, B.: Opensmile: the Munich versatile and fast open-source audio feature extractor. In: Proceedings of the International Conference on Multimedia - MM 2010. ACM Press (2010)
6.
Zurück zum Zitat Gemmeke, J.F., et al.: Audio set: an ontology and human-labeled dataset for audio events. In: 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, New Orleans (2017) Gemmeke, J.F., et al.: Audio set: an ontology and human-labeled dataset for audio events. In: 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, New Orleans (2017)
7.
Zurück zum Zitat Howard, A.G., et al.: MobileNets: efficient convolutional neural networks for mobile vision applications. arXiv:1704.04861 [cs], April 2017 Howard, A.G., et al.: MobileNets: efficient convolutional neural networks for mobile vision applications. arXiv:​1704.​04861 [cs], April 2017
8.
Zurück zum Zitat Jones, R., et al.: TREC 2020 podcasts track overview. In: Voorhees, E.M., Ellis, A. (eds.) Proceedings of the Twenty-Ninth Text REtrieval Conference (TREC). NIST (2021) Jones, R., et al.: TREC 2020 podcasts track overview. In: Voorhees, E.M., Ellis, A. (eds.) Proceedings of the Twenty-Ninth Text REtrieval Conference (TREC). NIST (2021)
9.
Zurück zum Zitat Jones, R., et al.: Current challenges and future directions in podcast information access. In: Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval (2021) Jones, R., et al.: Current challenges and future directions in podcast information access. In: Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval (2021)
10.
Zurück zum Zitat Martikainen, K.: Audio-based stylistic characteristics of Podcasts for search and recommendation: a user and computational analysis. Master’s thesis, University of Twente (2020) Martikainen, K.: Audio-based stylistic characteristics of Podcasts for search and recommendation: a user and computational analysis. Master’s thesis, University of Twente (2020)
Metadaten
Titel
Audio Features, Precomputed for Podcast Retrieval and Information Access Experiments
verfasst von
Abigail Alexander
Matthijs Mars
Josh C. Tingey
Haoyue Yu
Chris Backhouse
Sravana Reddy
Jussi Karlgren
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-030-85251-1_1

Premium Partner