Skip to main content

2022 | Buch

Datenanonymisierung im Kontext von Künstlicher Intelligenz und Big Data

Grundlagen – Elementare Techniken – Anwendung

insite
SUCHEN

Über dieses Buch

​Die fortschreitende Digitalisierung, die immer höhere Verfügbarkeit des Internets in Echtzeit sowie die progressive Entwicklung der IT ermöglichen es Unternehmen und Organisationen, Daten in einem nie zuvor dagewesenen Umfang zu erzeugen und zu verarbeiten, wodurch sie einen enormen Stellen- und Marktwert erhalten haben. Zudem kann mithilfe der künstlichen Intelligenz (KI) das in den Daten enthaltene Wissen extrahiert werden. Oft handelt es sich dabei um gesammelte Daten von Personen, mit denen Vorhersagen über verschiedene Aspekte der Personen getroffen werden können.

Das Buch befasst sich mit der Anonymisierung im Kontext der KI und Big Data. Dazu werden die wesentlichen Grundlagen dargestellt sowie pseudonymisierte und anonymisierte Daten mit Personenbezug im Rahmen der Datenschutz-Grundverordnung (DSGVO) und des Bundesdatenschutzgesetzes (BDSG) beleuchtet. Es werden Möglichkeiten zur Pseudonymisierung, zu den jeweiligen Techniken und Verfahren der Anonymisierung sowie entsprechende Risikobetrachtungen behandelt. Abschließend wird die Vorgehensweise der Anonymisierung aus rechtlicher und technischer Sicht unter Anwendung entsprechender Software behandelt.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Einleitung
Zusammenfassung
Die fortschreitende Digitalisierung, die immer höhere Verfügbarkeit des Internets in Echtzeit sowie die progressive Entwicklung der Informationstechnologie hat es Unternehmen, wissenschaftlichen Einrichtungen und Organisationen ermöglicht, Daten in einem noch nie dagewesenen Umfang und in einer Komplexität zu erzeugen, zu integrieren, zu speichern und zu analysieren, wodurch Daten einen enormen Stellen- und Marktwert erhalten haben.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 2. Künstliche Intelligenz
Zusammenfassung
Kognitive oder geistige Fähigkeiten von Computern und Maschinen, welchen menschlichen Fähigkeiten ähneln, werden als künstliche Intelligenz (KI) bezeichnet. Hierbei kann es sich um das Lernen aus Erfahrungen oder um die Lösung von Problemen handeln. Die künstliche Intelligenz eines Systems (Computers) kann mit dem sog. Turing-Test (Benannt nach dem britischen Mathematiker Alan M. Turing (1912–1954), vgl. Mainzer (2019) S. 10) analysiert werden, wobei ein Prüfer mit einem intelligenten menschlichen Experten sowie einem Computer parallel kommunizieren kann.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 3. Big Data und Analysemethoden
Zusammenfassung
Die durch innovative Systeme generierten Massendaten (sog. Big Data) zeichnen sich neben der Eigenschaft des (wachsenden) Datenvolumens (Volume) durch die Geschwindigkeit der Erzeugung und Verarbeitung von Datenströmen (Velocity), welche mit dem Datenvolumina in unmittelbarer Wechselwirkung stehen, sowie durch die Heterogenität strukturierter, semi- und unstrukturierter Daten mit verschiedenen Formaten und Strukturen aus einer Vielzahl unterschiedlicher Quellen (Variety) aus und sind daher möglicherweise mit einer gewissen Datenunsicherheit verbunden.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 4. Personenbezogene, pseudonymisierte und anonymisierte Daten
Zusammenfassung
Im Folgenden werden zunächst personenbezogene Daten definiert sowie anschließend von pseudonymisierten und anonymisierten Daten im Kontext der Datenschutz-Grundverordnung (DSGVO) und des Bundesdatenschutzgesetzes (BDSG) abgegrenzt.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 5. Techniken der Pseudonymisierung
Zusammenfassung
In der Datenschutz-Grundverordnung (DSGVO) wird die Pseudonymisierung als eine der möglichen technischen Maßnahmen genannt, um die Risiken betroffener Personen zu senken sowie den rechtlichen Anforderungen hinsichtlich des Datenschutzes zu entsprechen, wobei andere Datenschutzmaßnahmen damit nicht ausgeschlossen werden. Da die Pseudonymisierung wie auch die Anonymisierung eine Verarbeitung im Sinne der DSGVO darstellen, ist eine Rechtsgrundlage für diese Maßnahmen erforderlich.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 6. Anonymisierung strukturierter Daten
Zusammenfassung
Der Anlass für eine Anonymisierung von Daten ist immer dann gegeben, wenn eine Teilmenge von Daten aus einer (Datenbank-)Tabelle mit personenbezogenen Daten, die der Datenschutz-Grundverordnung (DSGVO) unterliegen, verarbeitet oder für Forschungszwecke zur Verfügung gestellt werden soll. Mithilfe der Anonymisierung soll eine Identifizierung von Personen anhand ihrer Daten verhindert werden.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 7. Anonymisierung unstrukturierter Daten
Zusammenfassung
Da bei strukturierten Daten jedes Attribut nur Werte aus einer sehr begrenzten Menge annehmen kann, ist aufgrund des Wissens über die möglichen Werte eine systematische Anonymisierung nach den vorgestellten Techniken und Verfahren möglich (vgl. Kap. 6). Bei semistrukturierten Daten können einzelne Attribute eines Datensatzes einen beliebig langen natürlichsprachlichen Freitext enthalten.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 8. Risiken der Nutzung anonymisierter Daten
Zusammenfassung
Im Rahmen der Anwendung von Anonymisierungstechniken gilt es, strikt zwischen Anonymisierung und Pseudonymisierung zu trennen respektive zwischen pseudonymisierten Daten und anonymisierten Daten zu differenzieren. Pseudonymisierte Daten ermöglichen das Herausgreifen einer einzelnen betroffenen Person sowie die Verknüpfung unterschiedlicher Datenbestände, sodass sie geeignet sind, eine Identifizierung zu ermöglichen. Daher fallen sie in den Anwendungsbereich der Datenschutz-Grundverordnung (DSGVO).
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 9. Verfahren zur Durchführung der Anonymisierung
Zusammenfassung
Die Anonymisierung ist ein Prozess, welcher auf personenbezogene Daten angewendet wird, mit dem Ziel, eine unumkehrbare Re-Identifizierung zu erreichen. So wird in der ISO 29100 der Begriff der Anonymisierung, wie folgt, definiert: „Anonymization is the process by which personally identifiable information (PII) is irreversibly altered in such a way that a PII principal can no longer be identified directly or indirectly, either by the PII controller alone or in collaboration with any other party.“
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 10. Software zur Unterstützung der Anonymisierung
Zusammenfassung
Zu den wesentlichen Zielen der Anonymisierung von Daten gehören eine angemessene Reduzierung von Re-Identifizierungsrisiken, eine Erhaltung der Nützlichkeit der Ausgabedaten sowie eine Skalierbarkeit des Anonymisierungsprozesses. Dabei müssen die Maßnahmen der Anonymisierung gewährleisten, die Nützlichkeit der Ausgabedaten und die verbleibenden Restrisiken der Re-Identifizierung in einem angemessenen Verhältnis zu bringen.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Kapitel 11. Fazit und Ausblick
Zusammenfassung
Im Zuge der fortschreitenden Digitalisierung ist ein verantwortungsvoller Umgang mit den Daten, welche digital erfasst, gespeichert, ausgetauscht und verarbeitet werden können, verstärkt in den Fokus der Betrachtung gerückt und stellt eine der größten Herausforderungen der heutigen Gesellschaft dar. Hierfür ist für jeden in der Gesellschaft ein grundlegendes Verständnis für die digitale Verarbeitung von Daten notwendig, da jeder bei der Anwendung digitaler Technologien Daten produziert, welche gespeichert und weiterverarbeitet werden können.
Heinz-Adalbert Krebs, Patricia Hagenweiler
Backmatter
Metadaten
Titel
Datenanonymisierung im Kontext von Künstlicher Intelligenz und Big Data
verfasst von
Dr. Heinz-Adalbert Krebs
Dr. Patricia Hagenweiler
Copyright-Jahr
2022
Electronic ISBN
978-3-658-37588-1
Print ISBN
978-3-658-37587-4
DOI
https://doi.org/10.1007/978-3-658-37588-1