Zum Inhalt

How to Detect Novelty in Textual Data Streams? A Comparative Study of Existing Methods

  • 2020
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Da Datensätze mit Anmerkungen zur Neuheit auf Dokumenten- und / oder Wortebene nicht ohne Weiteres verfügbar sind, präsentieren wir ein Simulationsrahmenwerk, das es uns ermöglicht, verschiedene Textdatensätze zu erstellen, in denen wir die Art und Weise kontrollieren, wie Neuheit entsteht. Außerdem präsentieren wir einen Benchmark bestehender Methoden zur Neuheitenerkennung in Textdatenströmen. Wir definieren ein paar Aufgaben zur Lösung und zum Vergleich mehrerer moderner Methoden. Das Simulationsrahmenwerk erlaubt es uns, ihre Leistung anhand einer Reihe begrenzter Szenarien zu bewerten und ihre Empfindlichkeit gegenüber einigen Parametern zu testen. Schließlich experimentieren wir im New York Times Annotated Dataset mit denselben Methoden zu verschiedenen Arten von Neuheiten.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
How to Detect Novelty in Textual Data Streams? A Comparative Study of Existing Methods
Verfasst von
Clément Christophe
Julien Velcin
Jairo Cugliari
Philippe Suignard
Manel Boumghar
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-030-39098-3_9
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Bild 1 Verspätete Verkaufsaufträge (Sage-Advertorial 3/2026)/© Sage, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen in 2025 und 2026/© amgun | Getty Images