Skip to main content

2025 | OriginalPaper | Buchkapitel

7. Datenintegration und Deduplizierung

verfasst von : Jens Bleiholder, Joachim Schmid

Erschienen in: Daten- und Informationsqualität

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

In der heutigen digitalen Welt sind Daten oft weltweit verteilt und in verschiedenen Formaten gespeichert. Dies stellt Unternehmen vor die Herausforderung, einen vollständigen und genauen Überblick über ihre Daten zu gewinnen. Der Beitrag beleuchtet die Techniken der Datenintegration, die es ermöglichen, Daten aus verschiedenen Quellen zusammenzuführen und einheitlich darzustellen. Ein zentrales Thema ist das Schema Matching, das die Angleichung von unterschiedlichen Datenstrukturen ermöglicht. Dabei werden sowohl schemabasierte als auch instanzbasierte Verfahren vorgestellt, die jeweils spezifische Vorteile bieten. Ein weiteres Kernstück des Beitrags ist die Dublettenerkennung, die darauf abzielt, mehrfach vorhandene Datensätze zu identifizieren und zu konsolidieren. Hier werden verschiedene Ähnlichkeitsmaße und Algorithmen diskutiert, die eine präzise Erkennung von Dubletten ermöglichen. Abschließend wird die Datenfusion behandelt, bei der Konflikte in den Daten gelöst und eine konsistente Darstellung der Daten erreicht wird. Der Beitrag bietet eine umfassende Übersicht über die verschiedenen Schritte und Techniken der Datenintegration und zeigt auf, wie diese in der Praxis angewendet werden können. Durch die detaillierte Darstellung und die praxisnahen Beispiele wird ein tiefes Verständnis für die Herausforderungen und Lösungsansätze der Datenintegration vermittelt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Metadaten
Titel
Datenintegration und Deduplizierung
verfasst von
Jens Bleiholder
Joachim Schmid
Copyright-Jahr
2025
DOI
https://doi.org/10.1007/978-3-658-47317-4_7