Zum Inhalt

Multi-level and Multi-granularity Fusion Network for Multimodal Named Entity Recognition

  • 2025
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Dieses Kapitel untersucht die Herausforderungen und Lösungen für multimodale Entity Recognition (MNER) in Social-Media-Beiträgen, die Text und Bilder kombinieren. Die Forschung führt ein mehrstufiges und mehrstufiges Fusionsnetzwerk (MMF) ein, das Texteigenschaften mithilfe externer Korpora verbessert und Mehrstufenmerkmale für eine bessere semantische Interaktion zwischen Text- und Bildmerkmalen integriert. Das Modell verwendet Contrastive Language-Image Pre-Training (CLIP) für eine verbesserte Text-Bild-Ausrichtung und verwendet eine Schicht bedingter Zufallsfelder (CRF) für die Etikettenvorhersage. Umfangreiche Experimente mit Twitter2015 und Twitter2017 Datensätzen zeigen, dass MMF bestehende Methoden übertrifft. Zu den wichtigsten Beiträgen zählen eine neuartige, multi-level, multi-granularity cross-modale NER-Architektur, ein erweiterter multimodaler Transformer zur Integration von multi-granularity features und der Einsatz von vorgeschultem CLIP für eine bessere cross-modale Ausrichtung. Die Effektivität des Modells wird durch Experimente verifiziert, die seine Überlegenheit gegenüber früheren Ansätzen demonstrieren.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
Multi-level and Multi-granularity Fusion Network for Multimodal Named Entity Recognition
Verfasst von
Yu Guo
Xiaoxu Hu
Gangyan Zeng
Xiaoyue Wu
Jing’ao Chen
Copyright-Jahr
2025
Verlag
Springer Nature Singapore
DOI
https://doi.org/10.1007/978-981-96-5006-4_96
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.