Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning
- 2026
- Buch
- Verfasst von
- Jakob Behnke
- Buchreihe
- BestMasters
- Verlag
- Springer Fachmedien Wiesbaden
Über dieses Buch
In diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden.
Inhaltsverzeichnis
-
Frontmatter
-
Kapitel 1. Einleitung
Jakob BehnkeZusammenfassungIn einer alternden Gesellschaft ist eine gute gesundheitliche Versorgung sehr wichtig. Der Kontakt zwischen behandelndem Fachpersonal und Patient*in ist dabei entscheidend. Eine klare Kommunikation, ob zwischen behandelnder Person und Patient*in oder auch interdisziplinär zwischen Behandelnden, kann entscheidend zum Erfolg einer Therapie beitragen [40]. -
Kapitel 2. Grundlagen
Jakob BehnkeZusammenfassungDieses Kapitel erklärt die grundlegende Begriffe und Konzepte dieser Arbeit. Zunächst wird der Begriff Automatic Speech Recognition erklärt. Anschließend werden Evolutionäre Algorithmen beschrieben sowie die verwendeten Bibliotheken DEAP und Optuna. -
Kapitel 3. Störempfindlichkeitsanalyse
Jakob BehnkeZusammenfassungIn diesem Kapitel wird die Störempfindlichkeit der Whisper-Modelle untersucht. Zunächst wird der Aufbau der Tests sowie die Generierung der gestörten Daten beschrieben. Anschließend werden die gewonnenen Daten analysiert. -
Kapitel 4. Optimierung
Jakob BehnkeZusammenfassungIn diesem Kapitel werden die Optimierungsversuche für Pluginketten zur Verbesserung der Transkripte beschrieben. Zunächst werden die Optimierungsverfahren beschrieben. Anschließend folgt die Durchführung, sowie der Vergleich der Ergebnisse. -
Kapitel 5. Fazit
Jakob BehnkeZusammenfassungZiel der vorliegenden Arbeit war die Untersuchung der Störempfindlichkeit des ASR-Werkzeugs Whisper. -
Backmatter
- Titel
- Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning
- Verfasst von
-
Jakob Behnke
- Copyright-Jahr
- 2026
- Electronic ISBN
- 978-3-658-50048-1
- Print ISBN
- 978-3-658-50047-4
- DOI
- https://doi.org/10.1007/978-3-658-50048-1
Die PDF-Dateien dieses Buches wurden gemäß dem PDF/UA-1-Standard erstellt, um die Barrierefreiheit zu verbessern. Dazu gehören Bildschirmlesegeräte, beschriebene nicht-textuelle Inhalte (Bilder, Grafiken), Lesezeichen für eine einfache Navigation, tastaturfreundliche Links und Formulare sowie durchsuchbarer und auswählbarer Text. Wir sind uns der Bedeutung von Barrierefreiheit bewusst und freuen uns über Anfragen zur Barrierefreiheit unserer Produkte. Bei Fragen oder Bedarf an Barrierefreiheit kontaktieren Sie uns bitte unter accessibilitysupport@springernature.com.