Zum Inhalt

02.06.2025 | Original Article

Hybrid Learning Based Visual Facial Emotion Recognition in Speech Videos

verfasst von: Yogesh Rochlani, A. B. Raut

Erschienen in: Annals of Data Science

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Der Artikel geht auf den kritischen Bereich der emotionalen Erkennung in der künstlichen Intelligenz ein und beleuchtet ihre Anwendungen in verschiedenen Bereichen wie Gesundheitswesen, autonomes Fahren und Mensch-Computer-Interaktion. Es betont die wachsende Notwendigkeit sicherer und zuverlässiger Methoden zum Schutz von Daten, wobei sich die Verhaltensbiometrie als vielversprechende Lösung herauskristallisiert. Die Forschung konzentriert sich auf die Herausforderungen und Fortschritte bei der Erkennung von Gesichtsemotionen, insbesondere in Sprachvideos, wo die Integration von Gesichts- und Sprachausdruck für die präzise Erkennung von Emotionen von entscheidender Bedeutung ist. Die Studie stellt einen hybriden Lernansatz vor, der tiefe konvolutionale neuronale Netzwerke zur Feature-Extraktion und maschinelle Lernklassifikatoren zur Emotion-Vorhersage nutzt. Die vorgeschlagene Methode wird anhand des RAVDESS-Datensatzes ausgewertet und ihre Leistung mit bestehenden Modellen verglichen. Die experimentellen Ergebnisse zeigen signifikante Verbesserungen bei Genauigkeit, Präzision, Recall und F1-Score, was das Potenzial des hybriden Ansatzes bei der Verbesserung von Emotionserkennungssystemen unterstreicht. Der Artikel diskutiert auch die Beschränkungen aktueller Modelle und schlägt zukünftige Forschungsrichtungen vor, einschließlich der Verwendung vielfältigerer und naturalistischerer emotionaler Datensätze und fortgeschrittener Techniken zur Datenerweiterung. Die detaillierte Analyse und vergleichende Bewertung gibt einen umfassenden Überblick über den aktuellen Zustand und die zukünftigen Aussichten der Gesichtserkennung in Sprachvideos.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Metadaten
Titel
Hybrid Learning Based Visual Facial Emotion Recognition in Speech Videos
verfasst von
Yogesh Rochlani
A. B. Raut
Publikationsdatum
02.06.2025
Verlag
Springer Berlin Heidelberg
Erschienen in
Annals of Data Science
Print ISSN: 2198-5804
Elektronische ISSN: 2198-5812
DOI
https://doi.org/10.1007/s40745-025-00613-z