Skip to main content

2011 | Buch

Linguistisches Identity Matching

Paradigmenwechsel in der Suche und im Abgleich von Personendaten

insite
SUCHEN

Über dieses Buch

Identity Matching ist die Grundlage für die Suche mit und nach Personendaten. Und die betreibt heutzutage die ganze Welt: Banken suchen Geldwäscher in ihren Kundendateien, Polizeibehörden überprüfen Verdächtige mit ihren Registern und Privatpersonen stöbern alte Bekannte im Web auf. Mittels Identity Matching besorgen sich Studenten Fachartikel, Journalisten Nachrichten, Vermieter Bonitätsauskünfte und Verkäufer ihre nächsten Marketing-Opfer. Das Problem bisher ist: Sobald wir den Namen nicht genau so schreiben, wie er in der Quelle repräsentiert ist, finden wir ihn nicht. Jetzt hebt die Linguistik das Identity Matching auf ein neues Niveau. Mit dem Wissen über Sprachen, Schriften und globale Namenskonventionen ist eine zugleich präzise und zuverlässige Personensuche möglich. Dieses Buch beschreibt, was linguistisches Identity Matching ist, und gibt Ihnen praktische Tipps, wie auch Sie davon profitieren können.

Inhaltsverzeichnis

Frontmatter

Einleitung: Paradigmenwechsel im Identity Matching

Einleitung: Paradigmenwechsel im Identity Matching
Zusammenfassung
Die Suche nach Personendaten ist uns allen gut vertraut. Wenn wir uns im Internet Kontaktdaten von Freunden, Arbeitskollegen oder Geschäftspartnern besorgen, starten wir einePersonensuche. Dasselbe tun wir, wenn wir aus privatem oder wissenschaftlichem Interesse über eine öffentliche Person recherchieren wollen. Natürlich sind wir selbst auch – und vielleicht weit häufiger als uns lieb ist – Gegenstand einer Personensuche.
Bertrand Lisbach

Grundlagen des linguistischen Identity Matching

Frontmatter
1. Grundkonzepte
Zusammenfassung
Identity Matching ist ein Vorgehen zur Beantwortung der Frage, ob zwei unterschiedliche Datenobjekte dieselbe oder verschiedene Personen repräsentieren. Dies geschieht, indem die Übereinstimmung der Merkmale beider Datenobjekte ermittelt wird. Bei den Datenobjekten handelt es sich typischerweise um Suchabfragen oder um Datenprofile (in Form von Datensätzen oder Indexstrukturen). Bei den Personen, die durch die Datenobjekte repräsentiert werden, kann es sich um natürliche Personen oder um juristische Personen handeln. Juristische Personen sind z.B. Stiftungen, Vereine oder Firmen.
Bertrand Lisbach
2. Anwendungsfelder
Zusammenfassung
Identity Matching ist nicht auf bestimmte Branchen beschränkt und auch nicht auf einzelne Geschäftsbereiche innerhalb eines Unternehmens. Identity Matching ist ein Elementarprozess, Teil vieler und vielfältiger übergeordneter Geschäftsprozesse. Schon in kleinen Unternehmen lassen sich in der Regel eine Handvoll Geschäftsprozesse ausmachen, in welchen Identity Matching eine bedeutende Rolle spielt. Bei größeren Unternehmen erreicht die Anzahl der Identity-Matching-nahen Geschäftsprozesse schnell einige Dutzend. Breite und Anzahl der Anwendungsfelder erklären das enorme Potenzial, das in der unternehmensweiten Standardisierung des Identity Matching steckt. Wird dieses Potenzial ausgeschöpft, ergeben sich erwartungstreue Suchergebnisse, eine erhöhte Zufriedenheit bei Kunden und Mitarbeitern und beachtliche Kostenvorteile in Entwicklung, Betrieb und Lizenzgebühren. Mehr dazu in Kap. 14.
Bertrand Lisbach
3. Grundlegendes zu Personennamen
Zusammenfassung
Dieses Kapitel vermittelt grundlegende Kenntnisse zu Personennamen, zu ihrer Struktur und zu ihrer historischen Entwicklung. Exemplarisch geht es auf die Merkmale von vier besonders wichtigen Personennamensystemen der Welt ein: dem westlichen, dem russischen, dem arabischen und dem chinesischen. Damit ist das Fundament zum Verständnis der sich anschließenden Kapitel gelegt, welche sich mit Schreibvariationen von Namen und den daraus ableitbaren Matchmethoden befassen.
Bertrand Lisbach
4. Transkription
Zusammenfassung
Dies ist der Alptraum eines jeden Compliance-Verantwortlichen einer Bank: Ein international gesuchter Geldwäscher, dessen Name auf öffentlich zugänglichen Listen firmiert, eröffnet ein Konto und wäscht in den darauf folgenden Tagen erhebliche Geldmengen, welche aus dem Waffen-und Drogenhandel stammen. Der Fall wird aufgedeckt und geht durch die Presse. Daraufhin wenden sich empörte Kunden von der Bank ab und kündigen die Geschäftsbeziehung. Sie wollen mit einer Bank nichts zu tun haben, welche in Waffen-und Drogengeschäfte verstrickt ist. Zudem schalten sich die zuständigen Aufsichtsbehörden ein. Es drohen schmerzhafte Geldbußen und sogar der Entzug der Banklizenz. Die Untersuchung des Falls zeigt, dass der Bankangestellte, der dem Geldwäscher das Konto eröffnet hat, allen Anweisungen zur Sorgfaltspflicht nachgekommen ist: Er hat sich pflichtgemäß die Ausweispapiere zeigen lassen und den Namen in der Form, in der er im Pass steht, zum Screening gegen verschiedene Listen eingegeben. Doch war das Name Matching Tool nicht in der Lage zu erkennen, dass der Name im Pass eine Transkriptionsvariante eines Namens auf der Liste gesuchter Geldwäscher ist.
Bertrand Lisbach
5. Abgeleitete Namensformen
Zusammenfassung
Wenn Menschen nicht unter ihrem ursprünglichen und offiziellen Namen bekannt sind, kann dies viele Gründe haben. Verbrecher fälschen ihren Ausweis und geben sich einen neuen Namen, um eine andere Identität anzunehmen. Unterhaltungskünstler wählen einen Künstlernamen, der zu ihrem Image besser passt. Und Autoren verschaffen sich durch die Verwendung von Pseudonymen mehr Freiheiten. In diesen Beispielen besteht zwischen den neu angenommen Zweitnamen und dem ursprünglichen Erstnamen keine vorhersagbare Beziehung. Daher können Erst-und Zweitnamen nicht regelbasiert oder durch die Verwendung von namenskundlichen Lexika gematcht werden. Der einzig praktikable Weg besteht darin, die Verbindung von Erst-und Zweitnamen im Datenprofil abzulegen.
Bertrand Lisbach
6. Phonetisches Matchen
Zusammenfassung
Wenn Namen derselben Person unterschiedlich geschrieben werden, ohne dass Transkriptionsvarianten vorliegen, so handelt es sich überwiegend um phonetisch gleichwertige Varianten. Ihr Schriftbild ist unterschiedlich, aber das Lautbild bleibt gleich. Solche Varianten werdenHomophone genannt.
Bertrand Lisbach
7. Tippfehler
Zusammenfassung
Wir haben bisher verschiedene Quellen vonVariationen in der Schreibung und Repräsentation von Namen kennengelernt. Der Begriff der Variation in diesem Sinne ist neutral und bedeutet nicht, dass ein Schreibfehler vorliegt. So können die meisten bisher besprochenen Variationsarten nicht als Schreibfehler bezeichnet werden. Dies gilt für Variationen
  • durch inkonsistentes Ablegen von Namenselementen in Namensdatenfelder (besprochen in Kapitel 3)
  • durch Anwendung unterschiedlicher Transkriptionsmethoden (Kapitel 4)
  • durch die uneinheitliche Verwendung von Namen in abgeleiteten oder übersetzten Formen sowie durch die Verwendung von Abkürzungen und Symbolen (Kapitel 5).
Bertrand Lisbach

Name-Matching-Verfahren

Frontmatter
8. Name-Matching-Verfahren der 1. Generation
Zusammenfassung
Als Name-Matching-Verfahren der ersten Generation (im Folgenden:G1-Verfahren) werden einfache Lösungen bezeichnet, die in technischer oder in linguistischer Hinsicht weit hinter den Möglichkeiten und Erfordernissen des Name-Matching-Marktes im 21. Jahrhundert zurückfallen. Zum überwiegenden Teil sind G1-Verfahren nicht speziell für das Name Matching entwickelt worden, und kein einziges nimmt die Herausforderungen des Name Matching im globalen Kontext an.
Bertrand Lisbach
9. Name-Matching-Verfahren der 2. Generation
Zusammenfassung
Name-Matching-Verfahren der 2. Generation (G2-Verfahren) sind direkte Weiterentwicklungen von G1-Verfahren. Einige der offenkundigsten Probleme ihrer Vorgänger sind in ihnen behoben worden, wodurch sie ihren Anwendern zu signifikant besseren Resultaten verhelfen. Da sie erst in jüngerer Zeit entstanden sind, ist ihre Implementierung trotz geringerer Erprobung technologisch oftmals auf einem noch besseren, da neueren Stand als Verfahren der ersten Generation. Gegenüber G1-Verfahren haben sie eigentlich nur Vorteile, sind aber weniger verbreitet als diese.
Bertrand Lisbach
10. Name-Matching-Verfahren der 3. Generation
Zusammenfassung
Name-Matching-Verfahren der 3. Generation unterscheiden sich von denen der 1. und 2. Generation darin, dass sie nicht einfach nur ein bereits existierendes, für das Identity Matching nur begrenzt taugliches Verfahren optimieren. Denn der Ausgangspunkt für die Lösungsfindung bilden inG3-Verfahren nicht bereits entwickelte Verfahren, sondern vielmehr Schreibvariationen von Namen. Die Lösungsmethode folgt also der Problemanalyse und nicht umgekehrt. Dies ist der simple Kern des Paradigmenwechsels, aus dem heraus G3-Verfahren entwickelt wurden.
Bertrand Lisbach
11. Benchmarkstudie: Die Verfahren im Vergleich
Zusammenfassung
In diesem Kapitel werden das Vorgehen und die Befunde einer Benchmarkstudie dargestellt, die zu dem Zwecke durchgeführt wurde, die Qualität einiger ausgesuchter G1-, G2- und G3-Verfahren zu vergleichen. Die Qualität wurde anhand der beiden Maße Recall (auch Trefferquote oder Zuverlässigkeit) und Precision (auch Präzision oder Genauigkeit) bestimmt. Die Datengrundlage besteht aus den Pofilen natürlicher Personen der sogenannten EU-Liste. Die EU-Liste ist öffentlich zugänglich. Finanzinstitute mit einer Geschäftsaktivität im EU-Raum sind verpflichtet, ihre Kunden regelmäßig gegen diese Liste zu prüfen.
Bertrand Lisbach

Bereit für den Paradigmenwechsel

Frontmatter
12. G3 Name Matching und Identity Matching
Zusammenfassung
Name Matching, also das Matchen von Personennamen, spielt fast immer die wichtigste Rolle im Identity Matching. Selten findet Identity Matching ganz ohne Namen statt, relativ häufig indes nur mit dem Namen. Name Matching ist auch jener Teil, in welchem sich der Paradigmenwechsel vom herkömmlichen zum linguistischen Identity Matching am stärksten auswirkt. Daher bildet das Matchen von (Personen-)Namen den Schwerpunkt in den meisten Kapiteln dieser Abhandlung. Den anderen Identitätsattributen, welche in der Suche nach und im Abgleich von Personendaten vorkommen, ist speziell dieses Kapitel gewidmet.
Bertrand Lisbach
13. Tipps zur Tool-Evaluation
Zusammenfassung
Die Qualität von Tools oder Modulen zum Identity Matching festzustellen, ist alles andere als ein triviales Unterfangen. Es sind dazu Spezialkenntnisse notwendig, die in den wenigsten privatwirtschaftlichen oder behördlichen Organisationen vorhanden sind. Dies unterscheidet Evaluationen im Bereich des Identity Matching von den meisten anderen Tool-Evaluationen.
Bertrand Lisbach
14. The Linguistic Search Standard
Zusammenfassung
Im Jahr 2010 steckt die Identity-Matching-Industrie mitten im Paradigmenwechsel. Herkömmliche Verfahren dominieren nach wie vor den Markt, doch ist der Qualitätsvorsprung durch linguistisches Identity Matching bereits in etlichen Anwendungen deutlich zu Tage getreten. Die Zahl der Kunden, die auf die möglich gewordene Steigerung an Zuverlässigkeit und Präzision nicht mehr verzichten wollen, wächst rapide an. Um mit diesen gestiegenen Erwartungen des Marktes schritthalten zu können, sind Anbieter von Identity Matching Tools dabei, ihre Lösungen um linguistische Komponenten zu erweitern.
Bertrand Lisbach
Backmatter
Metadaten
Titel
Linguistisches Identity Matching
verfasst von
Bertrand Lisbach
Copyright-Jahr
2011
Verlag
Vieweg+Teubner
Electronic ISBN
978-3-8348-9791-6
Print ISBN
978-3-8348-1371-8
DOI
https://doi.org/10.1007/978-3-8348-9791-6

Premium Partner