Zum Inhalt

Intelligent Information Processing XII

13th IFIP TC 12 International Conference, IIP 2024, Shenzhen, China, May 3–6, 2024, Proceedings, Part I

  • 2024
  • Buch

Über dieses Buch

Die zweibändigen IFIP AICT 703 und 704 bilden die referierten Konferenzunterlagen der 13. IFIP TC 12 International Conference on Intelligent Information Processing XII, IIP 2024, die vom 3. bis 6. Mai 2024 in Shenzhen, China, stattfand. Die 49 vollständigen und 5 kurzen Beiträge, die in diesem Verfahren präsentiert wurden, wurden sorgfältig geprüft und aus 58 Einreichungen ausgewählt. Die Vorträge sind in die folgenden thematischen Abschnitte gegliedert: Band I: Maschinelles Lernen; Verarbeitung natürlicher Sprache; Neuronales und Evolutionäres Rechnen; Empfehlungen und Soziales Rechnen; Business Intelligence und Risikokontrolle; und Mustererkennung. Band II: Image Understanding.

Inhaltsverzeichnis

Nächste
  • current Page 1
  • 2
  • 3
  1. Frontmatter

  2. Machine Learning

    1. Frontmatter

    2. Dual Contrastive Learning for Anomaly Detection in Attributed Networks

      Shijie Xue, He Kong, Qi Wang
      Das Kapitel konzentriert sich auf die kritische Frage der Erkennung von Anomalien in zugeordneten Netzwerken, die komplexe Szenarien der realen Welt modellieren, indem sie sowohl Knoteninteraktionen als auch reiche Attribute einbeziehen. Herkömmliche Methoden greifen oft zu kurz, wenn es darum geht, Anomalien auf verschiedenen Ebenen effektiv zu identifizieren. Die vorgeschlagene Cobra-Methode adressiert dies durch den Einsatz eines dualen kontrastiven Lernrahmens, der sowohl kontextbedingte als auch verhaltensbedingte Anomalien berücksichtigt. Durch die Erfassung von Subgrafien und den Einsatz selbstüberwachter Lernstrategien erfasst Cobra die komplizierten Beziehungen und Verhaltensweisen innerhalb des Netzwerks und liefert eine genauere und umfassendere Bewertung der Anomalie der Knotenpunkte. Umfangreiche Experimente mit verschiedenen Datensätzen zeigen die überlegene Leistung von Cobra im Vergleich zu hochmodernen Methoden und unterstreichen ihr Potenzial, die Erkennung von Anomalien in verschiedenen Anwendungen zu verbessern.
    3. Online Learning in Varying Feature Spaces with Informative Variation

      Peijia Qin, Liyan Song
      Das Kapitel behandelt die Grenzen des klassischen Online-Lernens, das einen konstanten Feature Space voraussetzt. Es führt das Konzept des Variying Feature Space (VFS) ein, in dem Merkmale erscheinen und mit der Zeit verschwinden können. Die Forschung konzentriert sich auf informative Variationen, die auf Klassenkennzeichnungen hindeuten können, was die Vorhersagekraft verbessert. Der vorgeschlagene Ansatz, OVFIV, kombiniert einen spärlichen Lerner für den Variationsraum mit einer Ensemblemethode, um Vorhersagen sowohl aus den Feature- als auch aus den Variationsströmen zu integrieren. Experimentelle Ergebnisse zeigen die Effektivität dieser Methode in verschiedenen Datensätzen und unterstreichen ihr Potenzial, die Vorhersagemodelle in dynamischen Merkmalsräumen signifikant zu verbessern.
    4. Towards a Flexible Accuracy-Oriented Deep Learning Module Inference Latency Prediction Framework for Adaptive Optimization Algorithms

      Jingran Shen, Nikos Tziritas, Georgios Theodoropoulos
      Das Kapitel diskutiert die Herausforderungen des Einsatzes großer neuronaler Netzwerke in ressourcenbeschränkten Randumgebungen und die Notwendigkeit adaptiver Optimierungsalgorithmen. Es führt ein neues Rahmenwerk ein, das flexible Konfigurationen von Eingabeparametern und die automatische Auswahl von Regressionsmodellen zur Vorhersage der Inferenz-Latenz von Modulen ermöglicht. Das vorgeschlagene Multi-task Encoder-Decoder Network (MEDN) wird als genauere und effizientere Alternative zu bestehenden Regressionsmodellen hervorgehoben. Die Fähigkeit des Frameworks, die Dynamik von Geräten zu messen und mit verschiedenen Eingabeparametern umzugehen, einschließlich folgerbarer Parameter, wird hervorgehoben. Experimentelle Ergebnisse zeigen die überlegene Leistung von MEDN und die Effektivität des zeit- und raumsparenden Auto-Selektions-Algorithmus. Auch zukünftige Forschungsrichtungen werden skizziert, wobei der Schwerpunkt auf der weiteren Verbesserung der Fähigkeiten des Rahmenwerks liegt.
    5. Table Orientation Classification Model Based on BERT and TCSMN

      Dawei Jin, Rongxin Mi, Tianhang Song
      Das Kapitel konzentriert sich auf die Klassifizierung von Tabellenorientierungen mithilfe eines Deep-Learning-Modells, das BERT für das kontextuelle Verständnis und TCSMN für die Erfassung sequentieller Merkmale kombiniert. Das Modell wurde entwickelt, um die vielfältigen Strukturen von Tabellen aus der wissenschaftlichen Literatur zu handhaben und bietet eine genauere und effizientere Methode zur Tabellenanalyse. Die Autoren führen reihen- und spaltenbasierte Aufmerksamkeitsmechanismen ein, um die Extraktion struktureller semantischer Merkmale zu verbessern und so zur hohen Leistung des Modells beizutragen. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene TableTC-Modell traditionelle und vertiefte Lernprozesse übertrifft und seine Wirksamkeit bei der Klassifizierung von Tabellen unter Beweis stellt. Das Kapitel behandelt auch verwandte Arbeiten und zukünftige Forschungsrichtungen, was es zu einer wertvollen Ressource für Fachleute und Forscher auf dem Gebiet der Verarbeitung natürlicher Sprache und der Datenanalyse macht.
    6. Divide-and-Conquer Strategy for Large-Scale Dynamic Bayesian Network Structure Learning

      Hui Ouyang, Cheng Chen, Ke Tang
      In diesem Kapitel wird eine Strategie des Teilens und Eroberens für das Lernen dynamischer bayesischer Netzwerkstrukturen in großem Maßstab vorgestellt, wobei der Schwerpunkt auf 2 zeitgeschnittenen bayesischen Netzwerken (2-TBNs) liegt. Die Methode, die an die Partition-Estimation-Fusion-Strategie (PEF) in statischen bayesischen Netzwerken angepasst wurde, zeigt deutliche Verbesserungen bei Genauigkeit und Effizienz. Durch die Nutzung von Vorkenntnissen über 2-TBNs verbessert der Ansatz den Lernprozess, insbesondere für das Übergangsmodell. Die experimentelle Validierung anhand umfangreicher Datensätze zeigt, dass die vorgeschlagene Strategie hinsichtlich Genauigkeit der Kantenklassifizierung und Laufzeit die Basismethoden übertrifft. Das Kapitel hebt auch das Potenzial für weitere Verbesserungen in der Partitions- und Fusionsphase hervor und diskutiert zukünftige Forschungsrichtungen.
    7. Entropy-Based Logic Explanations of Differentiable Decision Tree

      Yuanyuan Liu, Jiajia Zhang, Yifan Li
      Dieses Kapitel geht der Herausforderung nach, komplexe Entscheidungsfindungsprozesse im Rahmen eines vertieften Lernens zu interpretieren. Durch die Nutzung von Entropie-basierten logischen Erklärungen führen die Autoren eine Methode ein, um aktiv in die Ausbildung differenzierbarer Entscheidungsbäume einzugreifen, die Parameterexplosion zu verringern und die Interpretierbarkeit zu verbessern. Experimentelle Ergebnisse zeigen, dass dieser Ansatz nicht nur eine hohe Leistung aufrechterhält, sondern auch eine bessere Interpretationsfähigkeit im Vergleich zu Basismethoden erreicht. Die Neuheit liegt in der Anwendung von Entropie-Strafbestimmungen und staatlichen Vorverarbeitungstechniken, die den Trainingsprozess in Richtung erklärlicherer Modelle lenken. Das Kapitel schließt mit überzeugenden experimentellen Beweisen, die die Wirksamkeit der vorgeschlagenen Methode in multiplen Lernumgebungen zur Verstärkung aufzeigen.
    8. Deep Friendly Embedding Space for Clustering

      Haiwei Hou, Shifei Ding, Xiao Xu, Lili Guo
      Das Kapitel "Deep Friendly Embedding Space for Clustering" geht auf die Fortschritte von Deep-Clustering-Methoden ein und beleuchtet die Grenzen traditioneller Clustering-Algorithmen im Umgang mit großen, hochdimensionalen Datensätzen. Es führt einen einheitlichen Deep-Clustering-Algorithmus ein, der Autoencoder zur Feature-Extraktion und Dimensionalitätsreduzierung nutzt und tiefes metrisches Lernen zur Verbesserung der Feature-Diskriminierung einbezieht. Der vorgeschlagene Algorithmus bewahrt die vielfältige Struktur der Daten, was zu verbesserten Clusterergebnissen führt. Die experimentelle Validierung von Benchmark-Datensätzen und eine Fallstudie zur Diagnose von Wälzlagerfehlern zeigen die überlegene Leistung und das Potenzial des Algorithmus für industrielle Anwendungen. Das Kapitel schließt mit der Diskussion zukünftiger Forschungsrichtungen und betont die Bedeutung semi-überwachten Lernens und Pseudo-Labeltechnologie bei der Steuerung neuronaler Netzwerke, um geeignetere Darstellungen für Clusterbildung zu lernen.
    9. Bayesian Personalized Sorting Based on Time Factors and Hot Recommendations

      Wenhua Zeng, Junjie Liu, Bo Zhang
      In diesem Kapitel wird ein bayesianisches Modell für personalisiertes Ranking, BPR-TH, vorgestellt, das auf die Informationsüberlastung in digitalen Bibliotheken abzielt. Durch die Einbeziehung von Zeitfaktoren und heißen Empfehlungen bewältigt BPR-TH effektiv massive verteilte Daten und Kaltstartprobleme und übertrifft traditionelle BPR- und File-path-Algorithmen. Das Modell wird durch Extraktion, Modellbau und Optimierung des Nutzerverhaltens realisiert, was zu verbesserten personalisierten Empfehlungen sowohl online als auch offline führt. Experimentelle Ergebnisse zeigen, dass BPR-TH hinsichtlich Genauigkeit, Reichweite und Abruf herausragend ist, was es zu einer vielversprechenden Lösung für personalisierte digitale Bibliotheksempfehlungen macht.
    10. Design and Implementation of Risk Control Model Based on Deep Ensemble Learning Algorithm

      Maoguang Wang, Ying Cui
      Das Kapitel vertieft sich in die kritische Frage des Kreditrisikos bei Internetkrediten und schlägt ein bahnbrechendes Kreditrisikokontrollmodell vor, das auf tiefgreifendem gemeinsamen Lernen beruht. Durch den Aufbau eines zweischichtigen Lernensembles identifiziert das Modell effektiv potenzielle zahlungsunfähige Nutzer und erreicht einen beeindruckenden F1-Score von 0,98 im Kreditdatensatz des Lending Club. Dieser innovative Ansatz übertrifft herkömmliche Methoden wie logistische Regression und Entscheidungsbäume und zeigt exzellente Verallgemeinerungsfähigkeiten. Die Architektur des Modells, einschließlich der Auswahl der Lernenden und der Ensemblemethoden, ist sorgfältig entworfen, um sowohl allgemeine als auch nuancierte Muster in den Daten zu erfassen. Das Kapitel bietet außerdem eine umfassende Analyse verwandter Arbeiten, experimenteller Ergebnisse und zukünftiger Forschungsrichtungen, was es zu einer wertvollen Ressource für Fachleute macht, die Kreditrisikomanagementstrategien verbessern wollen.
    11. More Teachers Make Greater Students: Compression of CycleGAN

      Xiaoxi Liu, Lin Lv, Ju Liu, Yanyang Han, Mengnan Liang, Xiao Jiang
      Das Kapitel stellt das MGFD-Rahmenwerk vor, das entworfen wurde, um CycleGAN-Modelle effektiv zu komprimieren. Durch die Integration eines Inception-Enhanced Network und eines Multi-Granularitäts-Destillationsschemas vereinfacht MGFD den Kompressionsprozess und senkt die Rechenkosten. Das Rahmenwerk eliminiert die Notwendigkeit eines Diskriminators und optimiert den Studentengenerator direkt durch Wissensdestillation. Experimentelle Ergebnisse zeigen, dass MGFD in Bezug auf Recheneffizienz und Bildqualität bestehende Methoden übertrifft, was es zu einer vielversprechenden Lösung für praktische Anwendungen auf mobilen Geräten und IoT-Systemen macht.
    12. Hybrid Integrated Dimensionality Reduction Method Based on Conformal Homeomorphism Mapping

      Bianping Su, Chaoyin Liang, Chunkai Wang, Yufan Guo, Shicong Wu, Yan Chen, Longqing Zhang, Jiao Peng
      Dieses Kapitel stellt eine hybride integrierte Methode zur Reduzierung der Dimensionalität vor, die konforme Homöomorphismusabbildungen nutzt, um die Herausforderungen der Aufrechterhaltung geometrischer Struktur und Reversibilität bei der Datenreduzierung zu bewältigen. Die Methode kombiniert lineare, nichtlineare und hybride Dimensionalitätsreduktionstechniken, um sicherzustellen, dass die intrinsische Steifigkeit und die geometrische Topologiestruktur der Daten erhalten bleiben. In diesem Kapitel werden verschiedene Methoden zur Dimensionalitätsreduzierung diskutiert, darunter Principal Component Analysis (PCA), Locally Linear Embedding (LLE) und Laplacian Eigenmap (LE), wobei deren Vorteile und Grenzen herausgestellt werden. Die vorgeschlagene Methode integriert diese Techniken, um ein robustes Rahmenwerk zur Reduzierung der Dimensionalität zu schaffen, das sowohl effizient als auch interpretierbar ist. Das Kapitel enthält auch eine detaillierte Erklärung des konformen Kartierungsprozesses des Homöomorphismus und seiner Anwendung auf Textdaten, die die Wirksamkeit der Methode anhand experimenteller Ergebnisse demonstriert. Durch die Lektüre dieses Kapitels erhalten Fachleute im Bereich der Datenwissenschaft und des maschinellen Lernens wertvolle Einblicke in fortgeschrittene Techniken zur Reduzierung der Dimensionalität und ihre praktischen Anwendungen.
  3. Natural Language Processing

    1. Frontmatter

    2. Are Mixture-of-Modality-Experts Transformers Robust to Missing Modality During Training and Inferring?

      Yan Gao, Tong Xu, Enhong Chen
      Das Kapitel untersucht die Robustheit von Mixture-of-Modality-Experts Transformers (MoME), wenn sie mit fehlender Modalität während des Trainings und der Schlussfolgerung konfrontiert sind. Es beginnt mit der Diskussion der Grenzen aktueller multimodaler Transformatoren und der Notwendigkeit von Modellen, die unvollständige Daten verarbeiten können. Die Autoren schlagen eine Reihe von Unterfragen vor, um ihre Forschung zu leiten und Experimente durchzuführen, um die Robustheit von MoME Transformers mit Vanille Transformers zu vergleichen. Sie untersuchen auch den Einsatz von Multi-Task-Lern- und Datenimputationstechniken wie Mixup, um die Leistung des Modells zu verbessern. Das Kapitel schließt mit einer neuartigen Methode auf der Grundlage von MoME Transformers und Multi-Task-Lernen, die hohe Robustheit gegenüber fehlenden Modalitäten ohne zusätzliche Rechenanforderungen demonstriert. Die Methode wird durch Experimente an drei populären multimodalen Datensätzen validiert, die signifikante Verbesserungen gegenüber bestehenden Ansätzen aufweisen.
    3. Question Answering Systems Based on Pre-trained Language Models: Recent Progress

      Xudong Luo, Ying Luo, Binxia Yang
      Das Kapitel geht der zentralen Rolle von Pre-trained Language Models (PLMs) bei der Verbesserung von Question Answering Systems (QASs) nach, betont ihre Überlegenheit beim Verständnis komplexer Sprachmuster und liefert präzise, relevante Antworten. Es untersucht verschiedene PLM-basierte Methoden zur Informationsgewinnung, Verbesserung der QS-Performance und zur Bewältigung anderer QS-Herausforderungen. Darüber hinaus beleuchtet das Kapitel die Anwendungen PLM-basierter QASs in Bereichen wie rechtlichen, medizinischen und multimodalen QS und zeigt ihre Vielseitigkeit und ihr Potenzial auf. Die Diskussion umfasst Leistungsbewertungen und zukünftige Forschungsrichtungen, was sie zu einer wertvollen Ressource für Fachleute macht, die den aktuellen Stand der QASs verstehen wollen.
    4. A BERT-Based Model for Legal Document Proofreading

      Jinlong Liu, Xudong Luo
      Das Kapitel führt ein BERT-basiertes Modell für das Korrekturlesen von Rechtsdokumenten ein, das die entscheidende Notwendigkeit von Genauigkeit und Präzision in Rechtstexten berücksichtigt. Das Modell integriert zwei strukturell identische MLMs mit unterschiedlichen Trainingsmethoden zur Leistungssteigerung. Es umfasst ein Grammatikprüfungsmodul und ein Rechtschreibprüfungsmodul, die sich gegenseitig ergänzen, um Fehler effektiv zu korrigieren. Das Rechtschreibprüfungsmodul verwendet einen Limiter-Algorithmus, um Präzision und Abruf durch Berücksichtigung der Pinyin-Ähnlichkeit auszugleichen. Das Modell ist an einer Million künstlich erzeugter Rechtsdokumentensätze geschult, die im Vergleich zu Basismodellen und großen Sprachmodellen eine überlegene Leistung zeigen. Das Kapitel behandelt auch die Architektur, den Schulungsprozess und die experimentelle Evaluierung des Modells und hebt sein Potenzial hervor, das Korrekturlesen rechtlicher Dokumente zu revolutionieren.
    5. Entity Relation Joint Extraction with Data Augmentation Based on Large Language Model

      Manman Zhang, Shuocan Zhu, Jingmin Zhang, Yu Han, Xiaoxuan Zhu, Leilei Zhang
      Das Kapitel vertieft sich in die Anwendung großer Sprachmodelle zur Extraktion von Entitätsbeziehungen, wobei der Schwerpunkt auf Techniken zur Datenerweiterung liegt, um der Datenverknappung zu begegnen. Es werden zwei Methoden eingeführt - Entitätspaare-Dominante Datengenerierung (EDDG) und Relation-Dominante Datengenerierung (RDDG) - die ChatGPT zur Erzeugung kommentierter Daten verwenden. Die Studie betont auch die Bedeutung von Sofortstrategien wie Ausdrucksvielfalt, Längenvielfalt und Domänenvielfalt, um die Leistung der Modelle zu verbessern. Experimentelle Ergebnisse des DuIE-Datensatzes zeigen die Effektivität dieser Strategien auf und heben eine bemerkenswerte Zunahme der Formel-1-Werte in verschiedenen Modellen hervor. Das Kapitel schließt mit der Validierung der vorgeschlagenen Methoden und Strategien und zeigt ihr Potenzial zur Verbesserung der Aufgaben zur Extraktion von Entitätsbeziehungen auf.
Nächste
  • current Page 1
  • 2
  • 3
Titel
Intelligent Information Processing XII
Herausgegeben von
Zhongzhi Shi
Jim Torresen
Shengxiang Yang
Copyright-Jahr
2024
Electronic ISBN
978-3-031-57808-3
Print ISBN
978-3-031-57807-6
DOI
https://doi.org/10.1007/978-3-031-57808-3

Informationen zur Barrierefreiheit für dieses Buch folgen in Kürze. Wir arbeiten daran, sie so schnell wie möglich verfügbar zu machen. Vielen Dank für Ihre Geduld.

    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Bild 1 Verspätete Verkaufsaufträge (Sage-Advertorial 3/2026)/© Sage, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen in 2025 und 2026/© amgun | Getty Images