2009 | OriginalPaper | Buchkapitel
Duplikate in Datenbeständen
Erschienen in: Webbasierte Datenintegration
Verlag: Vieweg+Teubner
Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.
Wählen Sie Textabschnitte aus um mit Künstlicher Intelligenz passenden Patente zu finden. powered by
Markieren Sie Textabschnitte, um KI-gestützt weitere passende Inhalte zu finden. powered by
Duplikate sind eines der prominentesten Beispiele für Datenqualitätsprobleme in einem Datenbestand und spielen vor allem bei der Integration von sich überlappenden Informationsbeständen eine wichtige Rolle. Das folgende Kapitel gibt Aufschluss über die Entstehung und die Folgen von Dubletten, stellt ein allgemein gültiges Modell zur Vorgehensweise der Duplikatidentifizierung vor und geht im Anschluss auf die größten Schwierigkeiten bei der Dublettensuche ein.