Zum Inhalt

Natural Language Processing and Chinese Computing

13th National CCF Conference, NLPCC 2024, Hangzhou, China, November 1–3, 2024, Proceedings, Part IV

  • 2025
  • Buch

Über dieses Buch

Der fünfbändige Satz LNCS 15359 - 15363 ist das Referat der 13. Nationalen CCF-Konferenz zur Verarbeitung natürlicher Sprache und Chinesisches Rechnen, NLPCC 2024, die im November 2024 in Hangzhou, China, stattfand. Die 161 vollständigen Beiträge und 33 Workshoparbeiten zur Evaluierung, die in diesem Verfahren enthalten waren, wurden sorgfältig geprüft und aus 451 Einreichungen ausgewählt. Sie befassen sich mit den folgenden Bereichen: Grundlagen der NLP; Informationsextraktion und Wissensdiagramme; Informationsgewinnung, Dialogsysteme und Fragen beantworten; große Sprachmodelle und -agenten; maschinelles Lernen für NLP; maschinelle Übersetzung und Mehrsprachigkeit; Multimodalität und Erklärbarkeit; NLP-Anwendungen und Text-Mining; Sentiment Analysis, Argumentation Mining und Social Media; Zusammenfassung und Generierung.

Inhaltsverzeichnis

  • 1
  • 2
  • 3
  • current Page 4
Vorherige
  1. Sentiment Analysis/Argumentation Mining/Social Media

    1. Frontmatter

    2. Resolving Unseen Rumors with Retrieval-Augmented Large Language Models

      Lei Chen, Zhongyu Wei
      Das Kapitel geht den Herausforderungen bei der Lösung unsichtbarer Gerüchte in den sozialen Medien nach und beleuchtet die Beschränkungen aktueller Encoder-basierter Modelle und das Potenzial von Large Language Models (LLMs). Es führt einen erweiterten Retrieval-Workflow ein, der historisches Wissen und kollektive Intelligenz integriert, um die Genauigkeit der Erkennung von Gerüchten zu verbessern. Der Workflow ist darauf ausgelegt, LLMs bei der effektiven Nutzung ergänzender Informationen und der Bereitstellung rationaler, diskriminierender Ergebnisse zu leiten. Empirische Studien belegen die Effektivität dieses Ansatzes und zeigen signifikante Verbesserungen bei der Gerüchteauflösung im Vergleich zu herkömmlichen Methoden. Das Kapitel schließt mit der Diskussion zukünftiger Anweisungen zur Verbesserung der Fähigkeiten von LLMs bei der Lösung von Gerüchten.
    3. Hate Speech Detection for the Power Domain

      Qingbao Huang, Zehua Deng, Shizhen Chen, Yifei Chen, Feng Shuang
      Das Kapitel vertieft sich in das drängende Problem der Hassreden im Machtbereich und betont die Notwendigkeit effektiver Erkennungsmechanismen, um sozialen Schaden abzumildern. Es stellt einen einzigartigen Datensatz mit 6.000 Weibo-Beiträgen im Zusammenhang mit der Energiewirtschaft vor und schlägt das ProPh-Modell vor, das schnelle Lernprozesse und Bildunterschriften nutzt, um Hassreden präzise zu identifizieren. Die überlegene Leistung des Modells wird durch umfangreiche Experimente unter Beweis gestellt und zeigt sein Potenzial, die Sicherheit und Stabilität des Energiesystems und der Gesellschaft insgesamt deutlich zu verbessern.
    4. ValueCSV: Evaluating Core Socialist Values Understanding in Large Language Models

      Yuemei Xu, Ling Hu, Zihan Qiu
      Das Kapitel "ValueCSV: Evaluating Core Socialist Values Understanding in Large Language Models" befasst sich mit der entscheidenden Notwendigkeit, Large Language Models (LLMs) an menschlichen Werten auszurichten, insbesondere im chinesischen Kontext. Er führt das ValueCSV-Rahmenwerk ein, das das Verständnis und die Ausrichtung der LLMs an den 12 Dimensionen der Sozialistischen Kernwerte (CSV) bewertet. Das Rahmenwerk umfasst einen umfassenden Annotationsdatensatz, einen ausgebildeten CSV-Evaluator und einen Evaluationsfragedatensatz. Die Autoren führen umfangreiche Experimente über sechs LLMs durch, die die Effektivität des ValueCSV-Rahmenwerks bei der Bewertung der CSV-Ausrichtung zeigen. Diese Arbeit ist bedeutsam, da sie die Lücke in der Wertanpassungsforschung schließt und einen entscheidenden Maßstab für die Bewertung von LLMs in unterschiedlichen kulturellen und sozialen Kontexten darstellt.
    5. Integrating Multi-view Analysis: Multi-view Mixture-of-Expert for Textual Personality Detection

      Haohao Zhu, Xiaokun Zhang, Junyu Lu, Liang Yang, Hongfei Lin
      Das Kapitel geht der Bedeutung des Verständnisses der Persönlichkeitsinformationen der Nutzer für verschiedene nachgelagerte Aufgaben wie Empfehlungssysteme und personalisierte Werbung nach. Traditionelle Methoden zur Persönlichkeitsbewertung sind zeit- und arbeitsintensiv, aber die Verbreitung sozialer Medien hat eine automatisierte Persönlichkeitsanalyse möglich gemacht. Der Autor stellt das Multi-view Mixture-of-Expert (MvP) Framework vor, das ein Multi-view Mixture-of-Expert (MoE) verwendet, um Benutzerbeiträge aus verschiedenen Perspektiven zu modellieren und potenzielle Konflikte zwischen Repräsentationen zu entschärfen. Das MvP-Framework beinhaltet die Regulierung der Benutzerkonsistenz, um unterschiedliche Darstellungen in eine einheitliche Benutzerrepräsentation zu integrieren und so die Genauigkeit der Persönlichkeitserkennung zu erhöhen. Umfangreiche Experimente mit Benchmark-Datensätzen zeigen die Wirksamkeit des MvP-Modells und unterstreichen die Vorteile der Multiview-Modellierung bei der Persönlichkeitserkennung. Das Kapitel enthält auch eine detaillierte Analyse der Beiträge der einzelnen Schlüsselmodule innerhalb von MvP, die Einblicke in ihre Rolle bei der Verbesserung der Erkennungsleistung bietet.
    6. CEUS: Comment Emotion and User Stance Fusion Network for Fake News Detection

      Ning Geng, Zhenhua Tan, Tao Zhang, Danke Wu
      Das Kapitel stellt CEUS vor, ein Comment Emotion and User Stance Fusion Network zur Erkennung von Fake News auf Social-Media-Plattformen wie Weibo. Sie unterstreicht die Bedeutung emotionaler Faktoren in den Kommentaren der Nutzer und die polarisierten Diskussionen, die sie auslösen und die für die Identifizierung von Fake News von entscheidender Bedeutung sind. Die CEUS-Methode integriert semantische, emotionale und Haltungsmerkmale aus Kommentaren und nutzt fortgeschrittene Techniken wie Gate Recurrent Units (GRU) und Multi-Task-Lernen. Umfangreiche Experimente mit realen Datensätzen zeigen die überlegene Leistung von CEUS im Vergleich zu bestehenden Methoden und machen es zu einer vielversprechenden Lösung zur Bekämpfung der Verbreitung von Falschinformationen im Internet.
    7. FriendRec: A Graph Neural Network for Friend Recommendation

      Yun Bai, Zanyou Lai
      Das Kapitel stellt FriendRec vor, ein Graph Neural Network, das für Freundschaftsempfehlungen in sozialen Online-Netzwerken entwickelt wurde. Es beleuchtet die Entwicklung sozialer Netzwerke und die Anwendung von Graph Neural Networks (GNNs) beim Lernen von Daten aus sozialen Netzwerken. Die primären Daten, die für den Bau von Empfehlungssystemen verwendet werden, sind Benutzer-Artikel- und Benutzer-Benutzer-Diagramme, die Interaktionen und soziale Verbindungen darstellen. FriendRec aggregiert Nachbarschaftsdarstellungen, um latente Darstellungen von Knotenpunkten zu lernen, und prognostiziert potenzielle Verbindungen zwischen Nutzern, indem es die Ähnlichkeit ihrer Darstellungen vergleicht. Das Rahmenwerk besteht aus einem sozialen Aggregator und einem Interessenaggregator, die jeweils Sozial- und Interessenvertretungen erlernen. Der Social Aggregator verwendet LightGCN, um Darstellungen im Benutzer-Benutzer-Diagramm zu verbreiten, während der Interessenaggregator eine spezielle Ebene einsetzt, um die Interessenvertretung auf Grundlage von Benutzerbewertungen zu aggregieren. Die endgültige Darstellung wird durch eine gewichtete Summe von Sozial- und Interessenvertretungen ermittelt, die signifikante Verbesserungen bei der Empfehlungsleistung in realen Datensätzen aufweist. Das Kapitel behandelt auch die Wirksamkeit verschiedener Fusionsoperationen und die Auswirkungen von Hyperparametern auf die Modellleistung.
    8. CEMSSA: Contrastive-Enhanced and Multi-Scale Semantic-Aware Framework for Interactive Argument Pair Identification

      Hu Zhang, Zengtai Wu
      Das Kapitel stellt CEMSSA vor, ein neuartiges Rahmenwerk zur interaktiven Argument-Pair-Identifikation (IAPI) in rechtlichen und dialogischen Zusammenhängen. Es kombiniert widersprüchliches Lernen mit einem mehrskaligen semantischen Bewusstsein, um die Fähigkeit des Modells zu verbessern, zwischen Argumentationspaaren und Streitigkeiten und solchen ohne zu unterscheiden. Das Contrastive-Enhanced Modul nutzt NT-Xent Loss, um die Ähnlichkeit zwischen positiven Proben zu maximieren und zwischen negativen zu minimieren. Das Semantic-Aware-Modul mit mehreren Skalen verwendet eine bidirektionale Matching-Strategie und ein Option Comparison Network (OCN), um die Darstellung von Argumenten zu bereichern. Das Modul Adaptives Verlustgewicht passt die Verlustgewichte beider Module dynamisch an und optimiert so das Gleichgewicht zwischen ihnen. Experimentelle Ergebnisse zu den CAIL2023-ArgMine- und CMV-Datensätzen zeigen die Effektivität von CEMSSA, übertreffen starke Baselines und unterstreichen sein Potenzial, das Feld des Argument Mining zu revolutionieren.
    9. Target-Oriented Multimodal Sentiment Classification with Adaptive Modality Weighting

      Zhiyue Liu, Fanrong Ma
      Dieses Kapitel vertieft sich in die Feinheiten der zielorientierten multimodalen Sentiment-Klassifizierung und beleuchtet die Grenzen bestehender Methoden, die textliche und visuelle Informationen gleichermaßen verschmelzen. Es führt ein neuartiges Rahmenwerk mit adaptiver Modalitätsgewichtung ein, das jeder Modalität dynamisch Bedeutung zuweist, basierend auf ihrem Beitrag zur Stimmungsprognose. Das Rahmenwerk nutzt große visuelle Sprachmodelle, um zielspezifische Wissensbeschreibungen zu erstellen, die textuelle Modalität zu bereichern und die Klassifikationsgenauigkeit zu verbessern. Experimentelle Ergebnisse zu Benchmark-Datensätzen zeigen die überlegene Leistung der vorgeschlagenen Methode im Vergleich zu vergleichbaren Baselines.
    10. Leveraging Two-Stream Cause-Effect Relation for Emotion-Cause Analysis

      Junfeng Ran, Zailong Tian, Weiyao Luo, Sujian Li
      Das Kapitel befasst sich mit der Emotion-Cause Analysis (ECA), die darauf abzielt, emotionale Ausdrucksformen und ihre Gründe zu identifizieren. Es führt ein neuartiges Zwei-Ströme-Denkmodell ein, das die ECPE-Aufgabe in Angriff nimmt, indem es Ursache-Wirkung-Beziehungen unabhängig und gleichzeitig untersucht. Das Modell nutzt Diskurskonjunktionen, die von großen Sprachmodellen vorhergesagt werden, um das Verständnis von Ursache-Wirkung-Beziehungen zu verbessern und übertrifft bestehende Methoden hinsichtlich Präzision und Gesamtleistung. Die Forschung unterstreicht die Bedeutung von wechselseitigen Ursache-Wirkung-Beziehungen im ECA und zeigt das Potenzial der Einbeziehung von LLMs auf, um das Feld voranzubringen. Die Studie umfasst auch umfangreiche Experimente und Ablationsstudien, um die Wirksamkeit der vorgeschlagenen Methode zu bestätigen.
    11. Visage: Visual-Aware Generation of Adversarial Examples in Black-Box for Text Classification

      Hairui Zhao, Xinyu Li, Hongliang Li
      Das Kapitel stellt Visage vor, einen neuartigen Black-Box-Algorithmus zur Generierung von Gegenbeispielen für die Textklassifizierung. Visage konzentriert sich darauf, die visuelle Ähnlichkeit zwischen den ursprünglichen Textbeispielen und den AEs aufrechtzuerhalten, um sicherzustellen, dass die generierten Beispiele sowohl lesbar als auch wirksam sind, wenn es darum geht, Stimmungsklassifikatoren zu täuschen. Die Methode nutzt die Häufigkeit von Begriffen und die Kennzeichnung von Sprachbestandteilen, um wichtige Wörter zu identifizieren und sie durch visuell ähnliche Symbole zu ersetzen. Umfangreiche Experimente zeigen, dass von Visage generierte künstliche Intelligenz die Genauigkeit von Opfermodellen signifikant verringert und bestehende Methoden deutlich übertrifft. Zusätzlich verbessert die Einbeziehung dieser Nebenwirkungen in das gegnerische Training die Robustheit von Stimmungsklassifikatoren weiter. Das Kapitel unterstreicht die Bedeutung visueller Konsistenz bei der Erzeugung künstlicher Intelligenz und bietet einen praktischen Ansatz zur Verbesserung der Sicherheit von Textklassifikationsmodellen.
    12. TGAN: Temporal-Aware Graph Attention Network for Early Rumor Detection in Social Media

      Shubo Zhang, Jing Wei, Zhengyi Zhao, Binyang Li, Kam-Fai Wong
      Das Kapitel stellt TGAN vor, ein zeitlich bewusstes Graph Attention Network, das für die Früherkennung von Gerüchten in sozialen Medien entwickelt wurde. Traditionelle Methoden behandeln die Erkennung von Gerüchten als Klassifizierungsaufgabe und stützen sich dabei häufig auf vordefinierte Zeitintervalle oder eine feste Anzahl von Beiträgen. TGAN modelliert jedoch Gerüchtkaskaden als Grafiken und nutzt globale zeitliche Informationen, um variante Aufmerksamkeiten wie Nachbarschafts- und interaktive Aufmerksamkeiten zu erfassen, was die Genauigkeit der Gerüchteerkennung erhöht. Durch die Einbindung von Multi-Task-Learning zur Positionsklassifizierung und Gerüchteerkennung identifiziert TGAN nicht nur Gerüchte präzise, sondern schätzt auch die Berstzeit ein, was eine frühzeitige Intervention ermöglicht. Umfangreiche Experimente mit realen Datensätzen zeigen die überlegene Leistung von TGAN im Vergleich zu Benchmark-Methoden und unterstreichen sein Potenzial, die schädlichen Auswirkungen von Gerüchten durch frühzeitiges Erkennen zu mildern.
    13. Joint Graph Augmentation and Adaptive Synthetic Sampling for Imbalanced Node Classification

      Guangquan Lu, Wanxin Chen, Yadan Han, Jiamin Tang, Faliang Huang
      Das Kapitel "Joint Graph Augmentation and Adaptive Synthetic Sampling for Imbalanced Node Classification" stellt GraphAdasyn vor, einen bahnbrechenden Algorithmus, der die Herausforderung einer unausgewogenen Knotenklassifizierung in Graphendaten angehen soll. Die Methode kombiniert Techniken zur Graphenvergrößerung mit adaptiver synthetischer Abtastung, wodurch Graph Neural Networks (GNNs) effektiv aus unausgewogenen Datensätzen lernen können. Durch die Nutzung lokaler und globaler topologischer Informationen verbessert GraphAdasyn die Leistung von GNNs bei der Klassifizierung von Knotenpunkten. Der Algorithmus wurde durch Experimente mit mehreren Datensätzen aus der realen Welt umfassend validiert, was eine überlegene Leistung im Vergleich zu bestehenden Methoden zeigt. Das Kapitel bietet außerdem einen umfassenden Überblick über verwandte Arbeiten, Methoden und experimentelle Ergebnisse und ist somit eine wertvolle Ressource für Forscher und Praktiker im Bereich des maschinellen Lernens und der Graphendatenanalyse.
    14. Speech Encryption Scheme Based on Chaotic Memristor Neural Network and S-Box

      Dawei Zhao, Hui Yu, Chuan Chen, Lixiang Li, Ling Mi
      Das Kapitel untersucht ein bahnbrechendes Sprachverschlüsselungsschema, das chaotische neuronale Memristornetzwerke und S-Box integriert. Durch die Nutzung des komplexen chaotischen Verhaltens neuronaler Memristornetzwerke erreicht das System hohe Sicherheit und schnelle Verschlüsselungsgeschwindigkeiten. Durch den Einsatz der S-box wird die Robustheit der Verschlüsselung gegenüber verschiedenen Angriffen weiter erhöht. Die Autoren untersuchen das dynamische Verhalten des neuen neuronalen Netzwerkmodells und bieten umfassende experimentelle Simulationen und Sicherheitsanalysen an. Das vorgeschlagene Schema übertrifft bestehende Algorithmen in Bezug auf Sicherheitskennzahlen, was es zu einer vielversprechenden Lösung für den Schutz von Sprachdaten in Echtzeit-Anwendungen macht.
    15. Humor Recognition Based on Dual Graph Attention Network with Incongruity and Ambiguity Feature Extraction

      Zhichao Ping, Zhi Liu, Mengyi Wang, Hongfei Lin, Yijia Zhang
      Das Kapitel vertieft sich in die Komplexität der humoristischen Erkennung im Text und betont die Bedeutung von Unstimmigkeiten und Mehrdeutigkeitsmerkmalen. Es wird das Dual Graph Attention Network Feature Extraction Model (DGFEM) eingeführt, das grafische Aufmerksamkeitsnetzwerke nutzt, um semantische Verknüpfungen zu erkennen und die Extraktion dieser Merkmale zu verbessern. Die Architektur des Modells umfasst BERT-Schichten für kontextabhängige Kodierung und GAT-Schichten für Aufmerksamkeitsmechanismen, wodurch es komplizierte semantische Beziehungen und vielfache Bedeutungen mehrdeutiger Wörter erfassen kann. Experimente mit zwei öffentlichen Datensätzen zeigen die überlegene Leistung des DGFEM im Vergleich zu anderen Methoden und unterstreichen sein Potenzial bei der Förderung der Humorerkennung in der künstlichen Intelligenz.
  2. Backmatter

  • 1
  • 2
  • 3
  • current Page 4
Vorherige
Titel
Natural Language Processing and Chinese Computing
Herausgegeben von
Derek F. Wong
Zhongyu Wei
Muyun Yang
Copyright-Jahr
2025
Verlag
Springer Nature Singapore
Electronic ISBN
978-981-9794-40-9
Print ISBN
978-981-9794-39-3
DOI
https://doi.org/10.1007/978-981-97-9440-9

Informationen zur Barrierefreiheit für dieses Buch folgen in Kürze. Wir arbeiten daran, sie so schnell wie möglich verfügbar zu machen. Vielen Dank für Ihre Geduld.

    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Deutsche Telekom MMS GmbH/© Vendosoft, Noriis Network AG/© Noriis Network AG, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Videocast 1: Standbild/© Springer Fachmedien Wiesbaden, KI-Wissen für mittelständische Unternehmen/© Dell_Getty 1999938268, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen /© da-kuk / Getty Images / iStock