Zum Inhalt

Natural Language Processing and Chinese Computing

13th National CCF Conference, NLPCC 2024, Hangzhou, China, November 1–3, 2024, Proceedings, Part IV

  • 2025
  • Buch

Über dieses Buch

Der fünfbändige Satz LNCS 15359 - 15363 ist das Referat der 13. Nationalen CCF-Konferenz zur Verarbeitung natürlicher Sprache und Chinesisches Rechnen, NLPCC 2024, die im November 2024 in Hangzhou, China, stattfand. Die 161 vollständigen Beiträge und 33 Workshoparbeiten zur Evaluierung, die in diesem Verfahren enthalten waren, wurden sorgfältig geprüft und aus 451 Einreichungen ausgewählt. Sie befassen sich mit den folgenden Bereichen: Grundlagen der NLP; Informationsextraktion und Wissensdiagramme; Informationsgewinnung, Dialogsysteme und Fragen beantworten; große Sprachmodelle und -agenten; maschinelles Lernen für NLP; maschinelle Übersetzung und Mehrsprachigkeit; Multimodalität und Erklärbarkeit; NLP-Anwendungen und Text-Mining; Sentiment Analysis, Argumentation Mining und Social Media; Zusammenfassung und Generierung.

Inhaltsverzeichnis

Nächste
  • 1
  • 2
  • current Page 3
  • 4
Vorherige
  1. Summarization and Generation

    1. Frontmatter

    2. Activate Integrated Controllable Generation with Soft Prompt

      Jingkun Ma, Runzhe Zhan, Derek F. Wong, Lidia S. Chao
      Das Kapitel geht den Herausforderungen der kontrollierbaren Texterzeugung (CTG) anhand von vortrainierten Sprachmodellen (PLMs) nach. Es werden zwei Forschungsschwerpunkte diskutiert: Feinabstimmung und parametereffizientes Transferlernen (PETL). Die vorgeschlagene Activator-Methode adressiert die Beschränkungen statischer Steuermodule, indem sie Steuersignale dynamisch in weiche Eingabeaufforderungen umwandelt. Dieser Ansatz verbessert die Darstellung von Steuersignalen und integriert sie effektiv und zeigt überlegene Leistung bei verschiedenen CTG-Aufgaben. Das Kapitel führt auch kontrastive Strategien zur Aktivierung des Lernens und sofortige Isolationsverluste ein, um die Trainingsstabilität und die Effektivität der Kontrolle zu verbessern. Umfassende Experimente zur Generierung von Gedichten und zu Textaufgaben zeigen die Vielseitigkeit und Konkurrenzfähigkeit der Activator-Methode. Menschliche Bewertungen bestätigen weiter seine Überlegenheit bei der Erzeugung von kohärentem und natürlichem Text.
    3. DDR-ECC: Dictionary-Driven Chinese ASR Entity Correction with Controllable Decoding

      Dejun Wang
      Das Kapitel "DDR-ECC: Wörterbuch-gesteuerte chinesische ASR-Entitätskorrektur mit kontrollierbarer Decodierung" befasst sich mit der Herausforderung von ASR-Entitätsfehlern in Sprachtranskriptionssystemen. Es führt einen neuartigen Ansatz ein, der wörterbuchgestützte Techniken mit einer kontrollierbaren Dekodierungsstrategie kombiniert, um die Erkennung und Korrektur von Einheiten zu verbessern. Die vorgeschlagene Methode, DDR-ECC, verwendet ein Wörterbuch-Fuzzy-Matching-Modul, um mögliche Einheiten abzurufen, und einen Wörterbuch-gesteuerten Kontextcodierer, um Eingaben und entsprechende Kandidaten gleichzeitig zu kodieren. Der wörterbuchgeführte Decoder dekodiert das Zeichen dann anhand übereinstimmender Ergebnisse, was die Genauigkeit der ASR-Fehlerkorrektur deutlich erhöht. Experimentelle Ergebnisse an drei öffentlich zugänglichen Datensätzen zeigen die Wirksamkeit der vorgeschlagenen Methode, insbesondere bei der Verbesserung der Fehlerkorrektur. Der Einsatz einer kontrollierbaren Decodierungsstrategie reduziert das Auftreten von Halluzinationen weiter und verbessert die Qualität der Fehlerkorrektur insgesamt. Das Kapitel definiert außerdem einen neuen Maßstab, den Toleranzgrad (TD), um unzumutbare Dekodierungsergebnisse zu messen. Der Open-Source-Code und die Daten erleichtern die weitere Forschung auf dem Gebiet der ASR-Fehlerkorrektur.
    4. TiLTS:Tibetan Long Text Summarization Dataset

      Yanrong Hao, Bo Chen, Xiaobing Zhao
      Das Kapitel stellt TiLTS vor, einen tibetischen Langtext-Zusammenfassungs-Datensatz mit 36.507 Paaren (Dokument, Zusammenfassung), der deutlich größer ist als bestehende Datensätze wie Ti-SUM. Er diskutiert die Konstruktion des Datensatzes mithilfe maschineller Übersetzung und Feinabstimmung von Modellen, seine detaillierte Analyse und experimentelle Ergebnisse, die verschiedene Zusammenfassungs-Algorithmen vergleichen. Das Kapitel beleuchtet die Herausforderungen und Chancen, die TiLTS im Bereich der Verarbeitung natürlicher Sprache mit sich bringt, insbesondere für ressourcenarme Sprachen wie Tibetisch.
    5. Enhancing Cross-Lingual Topic-Essay Generation with Knowledge and Topic Consistency Constraints

      Huailing Gu, Yuxin Huang, Zhengtao Yu, Cunli Mao
      Das Kapitel vertieft sich in die Aufgabe der lingualen Erstellung von Themen-Essays, bei der es darum geht, schlüssige und flüssige Kurztexte in einer Zielsprache zu erstellen, die auf Stichwörtern aus einer Ausgangssprache basieren. Bestehende Forschungen konzentrieren sich in erster Linie auf maschinelle Übersetzung, sprachübergreifende Zusammenfassung und Dialoggenerierung. Die Autoren heben die Probleme der mangelnden Konsistenz zwischen generierten Texten und Eingabethemenwörtern sowie die Schwierigkeiten bei der semantischen Abstimmung zwischen Sprachen hervor. Sie schlagen eine Methode vor, die wissensbeschränktes Lernen durch Wissensdestillation und die Durchsetzung von Themenkonsistenz durch kosinale Ähnlichkeit integriert. Dieser Ansatz adressiert sowohl sprachübergreifende semantische Ausrichtung als auch Themen-Konsistenz-Probleme, was zu einer überlegenen Kurztexterzeugung führt. Die Methode wird durch Experimente mit selbstkonstruierten chinesisch-vietnamesischen und chinesisch-englischen Datensätzen validiert, die signifikante Verbesserungen gegenüber Basismodellen aufweisen. Das Kapitel schließt mit der Betonung der praktischen Anwendung der vorgeschlagenen Methode bei der Reduzierung menschlicher Anstrengungen und der Steigerung der Arbeitseffizienz bei Aufgaben wie Nachrichtenbearbeitung und E-Mail-Zusammenstellung.
    6. Sequential Structured Fusion of Image and Text for Enhanced Multimodal Abstractive Summarization

      Rui He, Minjie Qiang, Hongling Wang, Zhongqing Wang
      Das Kapitel vertieft sich in die fortgeschrittene Methode der sequentiellen strukturierten Verschmelzung von Bild und Text für eine verbesserte multimodale Zusammenfassung. Es führt ein neues Ausbildungsrahmenwerk, SSMAS, ein, das die Verschmelzung von Bild und Text durch kontrastives Lernen und Bildunterschriften-Generierung deutlich verbessert. Das Rahmenwerk enthält auch einen sequentiell strukturierten multimodalen Encoder, um die kontextuellen Beziehungen zwischen Bild und Text besser zu erfassen. Experimentelle Ergebnisse zeigen, dass die SSMAS bestehende Methoden übertrifft und ihr Potenzial zur Revolutionierung multimodaler Zusammenfassungsprozesse hervorhebt. Das Kapitel präsentiert auch einen umfangreichen sequentiellen strukturierten multimodalen Zusammenfassungs-Datensatz, SSMSum, der zur Weiterentwicklung der Forschung in diesem Bereich beiträgt.
    7. Preserving Content in Text Style Transfer via Normalizing Flow and Adversarial Learning

      Jinqiao Dai, Pengsen Cheng, Yan Song, Jiayong Liu
      Das Kapitel befasst sich mit den Herausforderungen eines unbeaufsichtigten Textstiltransfers, insbesondere mit dem Thema der Erhaltung von Inhalten. Es schlägt ein neuartiges, flussbasiertes Redaktionsmodul vor, das mit einer Encoder-Decoder-Architektur und einem Lernmodul zur Verbesserung der Erhaltung von Inhalten kombiniert ist. Die theoretisch verlustfreien Transformationen des Strömungsmodells und der kontradiktorische Lernprozess werden eingesetzt, um die Auswirkungen des Stiltransfers auf den ursprünglichen Inhalt zu minimieren. Das Kapitel stellt außerdem umfangreiche Experimente und Vergleiche mit Benchmark-Methoden vor und zeigt die überlegene Leistung des vorgeschlagenen FST-Modells sowohl in Bezug auf die Genauigkeit der Stilübertragung als auch auf die Erhaltung des Inhalts. Zusätzlich enthält es Studien zur Evaluierung und Ablation am Menschen, um die Wirksamkeit des Modells weiter zu validieren.
Nächste
  • 1
  • 2
  • current Page 3
  • 4
Vorherige
Titel
Natural Language Processing and Chinese Computing
Herausgegeben von
Derek F. Wong
Zhongyu Wei
Muyun Yang
Copyright-Jahr
2025
Verlag
Springer Nature Singapore
Electronic ISBN
978-981-9794-40-9
Print ISBN
978-981-9794-39-3
DOI
https://doi.org/10.1007/978-981-97-9440-9

Informationen zur Barrierefreiheit für dieses Buch folgen in Kürze. Wir arbeiten daran, sie so schnell wie möglich verfügbar zu machen. Vielen Dank für Ihre Geduld.

    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Deutsche Telekom MMS GmbH/© Vendosoft, Noriis Network AG/© Noriis Network AG, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Videocast 1: Standbild/© Springer Fachmedien Wiesbaden, KI-Wissen für mittelständische Unternehmen/© Dell_Getty 1999938268, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen /© da-kuk / Getty Images / iStock