Skip to main content
Erschienen in: AStA Wirtschafts- und Sozialstatistisches Archiv 4/2014

01.11.2014 | Kommentar

Datenzugang in Deutschland: Der Paradigmenwechsel hat bereits stattgefunden

verfasst von: Stefan Bender

Erschienen in: AStA Wirtschafts- und Sozialstatistisches Archiv | Ausgabe 4/2014

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Auszug

Der Datenzugang zu (sensiblen) Mikrodaten für die Sozial- und Wirtschaftswissenschaften in Deutschland ist eine Erfolgsgeschichte. Betrachtet man die Entwicklung in den letzten 15 Jahren, so ist festzustellen: In Deutschland hat sich eine „Kultur des Datenzugangs“ etabliert, die so nicht vorherzusehen war. Ausgangspunkt war – wie Ulrich Rendtel richtig betont – die Einrichtung der Kommission zur Verbesserung der informationellen Infrastruktur (KVI) und ihr Gutachten aus dem Jahr 2001. Viele dieser Empfehlungen wurden in der Zwischenzeit umgesetzt, so auch die Einrichtung von Forschungsdatenzentren bei den „großen“ Datenproduzenten (Statistische Ämter, Deutsche Rentenversicherung, Bundesagentur für Arbeit). Ein weiterer und international einzigartiger Bestandteil der Dateninfrastruktur in Deutschland ist der Rat für Sozial- und Wirtschaftsdaten (RatSWD). Er wurde 2004 gegründet mit der Zielsetzung, die Forschungsdateninfrastruktur für die empirische Forschung nachhaltig zu verbessern und somit zu ihrer internationalen Wettbewerbsfähigkeit beizutragen (vgl. www.ratswd.de). Bemerkenswert an dieser Entwicklung ist nicht nur der anhaltende Dialog zwischen Wissenschaft, Forschung und Datenschutz zur weiteren Verbesserung des Datenzugangs in den Sozial- und Wirtschaftswissenschaften, sondern auch der vollzogene Paradigmenwechsel von einem „Datenprotektionismus“ zu einem „gleichberechtigten Datenzugang“. So hat der RatSWD bewirkt, dass Forschungsinstitutionen, die Nutzung ihrer eigenen Daten für Dritte über Forschungsdatenzentren ermöglichen. Daher sind momentan – Stand November 2014–28 Forschungsdatenzentren beim RatSWD akkreditiert. Für die Akkreditierung hat der RatSWD klare Regelungen aufgestellt. Nichtdestotrotz ist die FDZ-Landschaft – so meine Wahrnehmung – heterogen und fast schon unübersichtlich geworden.1

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Auf Grund der Heterogenität der FDZ-Landschaft wird hier eine tiefer gehende Definition einzelner FDZs als bei Ulrich Rendtel verwendet. Seine Aussagen beziehen sich nahezu nur auf die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder (www.forschungsdatenzentrum.de). Auch muss man nicht unbedingt seiner Definition von amtlicher Statistik zustimmen(vgl. hierzu auch http://​wirtschaftslexik​on.​gabler.​de/​Archiv/​959/​amtliche-statistik-v8.​html).
 
2
Der Datenzugang beim Nationalen Bildungspanel über RemoteNEPS (u.a. mit einem biometrischen Authentifizierungssystem) ist beispielsweise einzigartig in Deutschland (https://​www.​neps-data.​de/​de-de/​datenzentrum/​datenzugang/​remoteneps.​aspx).
 
3
Ausnahme stellen Schulungen einzelner FDZ zum jeweiligen Datenangebot und die Workshop-Reihe datalab@uni-bielefeld (datalab2011@uni-bielefeld, datalab2012@uni-bielefeld und datalab2013@uni-bielefeld) dar. Datalab@uni-bielefeld zeichnete sich dadurch aus, dass mehrere Datenanbieter gemeinsam ihre Daten interessierten Forscherinnen und Forschern darstellen konnten. Leider – so mein Wissensstand – sind für diese Veranstaltung keine Gelder mehr vorhanden.
 
4
In vielen anderen Ländern müssen die Kosten nicht zu 100 Prozent von den Datenanbietern getragen werden. Dies vergisst Ulrich Rendtel in seinem (selektiven) Blick in andere europäische Länder zu erwähnen.
 
5
Ich möchte hier nicht missverstanden werden: Natürlich hat ein Datenzugang für Externe auch immer einen positiven Effekt beim Datenproduzenten, z.B. bei der Verbesserung der Datenqualität, Marketing-Aspekte bei der Verwendung von wissenschaftlichen Ergebnissen für die eigene tägliche Praxis. Dieser Nutzen rechtfertigt jedoch nicht die alleinige Kostenübernahe auf Seiten der Datenproduzenten, obwohl beispielsweise die Bundesagentur für Arbeit wie auch die Deutsche Rentenversicherung momentan die vollen Kosten des Datenzugangs übernehmen.
 
6
Leider sind in dem folgenden Zitat von Ulrich Rendtel diverse Ungenauigkeiten enthalten, denen mit kurzen Statements entgegnet werden muss:
„In diesen Fällen müssen die Wissenschaftler auf die kontrollierte Datenfernverarbeitung ausweichen oder aber als Gastwissenschaftler das FDZ aufsuchen. Allerdings dürfen sie nur dann den Output einsehen, wenn er dem weitaus schärferen Kriterium der absoluten Anonymität entspricht. Die Wissenschaftler werden also wie jeder andere Nutzer behandelt und verlieren bei diesem Datenzugang ihr Wissenschaftsprivileg. Hält man sich den geringen Anteil der Scientific Use Files am Datenangebot vor Augen, so ist diese Regelung ein herber Verlust für das Auswertungsinteresse der Wissenschaft. Da diese Regelung durch das BStatG nicht zwingend vorgegeben ist, wäre schon einiges gewonnen, wenn man in Rahmen der kontrollierten Datenfernverarbeitung die Kontrolle von absolut anonym auf faktisch anonym reduziert.“ (Ulrich Rendtel)
Entgegnung:
Im Gastaufenthalt darf jeder beliebige Output am Bildschirm angesehen werden. Erst wenn der Output das FDZ der BA im IAB verlassen soll, wird dieser geprüft und absolut anonymisiert.
1. Die Wissenschaftlerinnen und Wissenschaftler werden nicht, wie jeder anderer Nutzer behandelt, da die anderen Nutzerinnen und Nutzer überhaupt nicht an das Privileg einer Auswertung kommen.
2. Ein Output, der das FDZ der BA im IAB verlässt, kann potentiell von jedem angesehen werden. Daher ist dieser Output auf absolute Anonymität zu prüfen.
3. Nach Ulrich Rendtel soll die Auswertung eines verfremden Scientific Use File besser sein als die Analyse an den fast unveränderten Daten mit anschließender Outputkontrolle. Nach meinen Erfahrungen ist es besser, wenn die Analyse mit einem möglichst nicht verfremdeten Datensatz durchgeführt wird, da eine Beurteilung der Qualität des Outputs besser ist. Da die Anonymisierung eines Outputs meist in der Aggregation bzw. im Weglassen von Werten besteht, kann – auch durch den Vergleich des Outputs vor und nach der Anonymisierung – der „Schaden“ der Anonymisierung besser beurteilt werden. Dies gilt umso mehr, wenn multivariate Analysen durchgeführt werden. Hier kann der Output meist ohne Änderungen weitergegeben werden, Daher ist die Nutzung der Originaldaten mit anschließender Outputkontrolle der Nutzung eines Scientific Use Files vorzuziehen.
4. Wie soll ein faktisch anonymer Output aussehen? Die Fallzahlen für die Erreichung der absoluten Anonymität in einem Output sind meist auch vergleichsweise niedrig. Daher klafft meist keine große Lücke zwischen dem gewünschten und dem anonymisierten Output (außer man hat ein Interesse anEinzelfallanalysen).
 
7
Die Zugangsarten Campus Files oder Public Use Files werden hier nicht weiter betrachtet. Sie sind in der Regel stärker anonymisierte Scientific Use Files, weil sie dem Kriterium „absolute Anonymität“ genügen müssen.
 
8
Die Schalterstelle war sehr erfolgreich: In den ersten zwei Jahren konnten mehr als 250 Anfragen von fast 100 Wissenschaftlerinnen und Wissenschaftlern bearbeitet werden (Kölling 2001).
 
9
Nachfolgender Text zu den Nutzungszahlen (inkl. der beiden Abbildungen) ist aus Bender et al. (2014b).
 
10
Ein Projekt kann mehrere Personen umfassen, über mehrere Jahre laufen und mehrere Datensätze sowie Zugangswege kombinieren.
 
11
Trotz der vielen Gastaufenthalte wurden in 2013 beispielsweise 1875 Outputs aus der Datenfernverarbeitung datenschutzrechtlich im FDZ der BA im IAB geprüft. In der Regel geht der geprüfte Output am gleichen oder am nächsten Tag an die Nutzerinnen oder Nutzer (vgl. Bender et al. 2014b).
 
12
http://www.oecd.org/std/microdata-access-final-report-OECD-2014.pdf
 
13
http://www.dwbproject.org/export/sites/default/about/public_deliveraples/d4_1_current_sc_in_europe_report_full.pdf.
 
14
Da Ulrich Rendtel mit Big Data schließt, möchte ich dies auch tun. Auch wenn hier eigentlich der notwendige Platz für eine umfassende Diskussion nicht vorhanden ist.
 
15
Big Data wird über die Datenkomplexität definiert, die sich durch ein hohes Datenvolumen (volume), eine hohe Datenrate (velocity), einer hohen Datenheterogenität (variety)) und unbestimmter Datenqualität (veracity) charakterisieren lässt.
 
16
Eine Diskussion darüber, ob die Regeln von Müller et al. (1991) zur Erstellung von Scientific Use Files vor dem Hintergrund eines stetig wachsenden, immer detaillierten und immer leichter zugänglich werdenden Zusatzwissens noch gelten können, erscheint mir überfällig. Vielleicht sind auch deshalb die Zugangswege „Datenfernverarbeitung“ und „Gastaufenthalte“ zu präferieren. Hier spielt ein mögliches Zusatzwissen nur eine untergeordnete Rolle, weil es für eine mögliche Deanonymisierung nicht direkt eingesetzt werden kann.
 
17
Diese Link lohnt sich alleine deshalb zu öffnen, um die Millionenbeträge, die England momentan für den Zugang zu diesen Daten investiert, mit denen in Deutschland zu vergleichen.
 
18
Dies führt beispielsweise zu Informationsanfragen aus dem Ausland (hier Indien): http://www.thehindubusinessline.com/opinion/the-importance-of-labour-statistics/article6475770.ece#comments.
 
19
Hier sei auf die Tagung von Hella von Unger und Jasmin Siri (beide LMU) hingewiesen: http://www.qualitative-sozialforschung.soziologie.uni-muenchen.de/tagung/programm-11_09_14.html.
 
Literatur
Zurück zum Zitat Bender S, Burghardt A, Schiller D (2014a) International access to administrative data for Germany and Europe. In: Dusa A, Nelle D, Stock G, Wagner G (Hrsg) Facing the future. European research infrastructures for the humanities and social sciences. Scivero, Berlin, S 75–86 Bender S, Burghardt A, Schiller D (2014a) International access to administrative data for Germany and Europe. In: Dusa A, Nelle D, Stock G, Wagner G (Hrsg) Facing the future. European research infrastructures for the humanities and social sciences. Scivero, Berlin, S 75–86
Zurück zum Zitat Bender S, Heining J (2011) The Research-Data-Centre in Research-Data-Centre approach: a first step towards decentralised international data sharing. IASSIST Quarterly 35(3):10–16 Bender S, Heining J (2011) The Research-Data-Centre in Research-Data-Centre approach: a first step towards decentralised international data sharing. IASSIST Quarterly 35(3):10–16
Zurück zum Zitat Bender S, Schmucker A, Dietrich I, Gunselmann I, Müller D, Seth S, Zakrocki V (2014b) FDZ-Jahresbericht 2011–2013. (FDZ-Methodenreport, 08/2014 (de), Nürnberg, 23 S Bender S, Schmucker A, Dietrich I, Gunselmann I, Müller D, Seth S, Zakrocki V (2014b) FDZ-Jahresbericht 2011–2013. (FDZ-Methodenreport, 08/2014 (de), Nürnberg, 23 S
Zurück zum Zitat Brandt M (2012) European data access comes true: decentralised and remote access to confidential data in the ESS (ESSnet DARA). In: PSD’12 Proceedings of the 2012 international conference on Privacy in Statistical Databases. Springer Verlag, Heidelberg, S 286–294 Brandt M (2012) European data access comes true: decentralised and remote access to confidential data in the ESS (ESSnet DARA). In: PSD’12 Proceedings of the 2012 international conference on Privacy in Statistical Databases. Springer Verlag, Heidelberg, S 286–294
Zurück zum Zitat Hören T (2014) Big Data und Recht. C H Beck, München Hören T (2014) Big Data und Recht. C H Beck, München
Zurück zum Zitat Kölling A (2000) The IAB-Establishment Panel. Schmollers Jahrbuch. Zeitschrift für Wirtschafts- und Sozialwissenschaften 120(2):291–300 Kölling A (2000) The IAB-Establishment Panel. Schmollers Jahrbuch. Zeitschrift für Wirtschafts- und Sozialwissenschaften 120(2):291–300
Zurück zum Zitat Kölling A (2001) Ein „Schalter“ für die Forschung * Daten des IAB-Betriebspanels stehen externen Forschern seit 1999 zur Verfügung. (09/2001), IAB-Werkstattbericht, Nürnberg, 5 S Kölling A (2001) Ein „Schalter“ für die Forschung * Daten des IAB-Betriebspanels stehen externen Forschern seit 1999 zur Verfügung. (09/2001), IAB-Werkstattbericht, Nürnberg, 5 S
Zurück zum Zitat Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik (KVI) (2001) Wege zu einer besseren informationellen Infrastruktur. Nomos Verlagsgesellschaft, Baden-Baden Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik (KVI) (2001) Wege zu einer besseren informationellen Infrastruktur. Nomos Verlagsgesellschaft, Baden-Baden
Zurück zum Zitat Lane J, Heus P, Mulcahy T (2008) Data access in a cyber world: Making use of cyberinfrastructure. Trans Data Priv 1:2–16MathSciNet Lane J, Heus P, Mulcahy T (2008) Data access in a cyber world: Making use of cyberinfrastructure. Trans Data Priv 1:2–16MathSciNet
Zurück zum Zitat Lane J, Stodden V, Bender S, Nissenbaum H (Hrsg) (2014) Privacy, big data, and the public good * frameworks for engagement. Cambridge University Press, CambridgeCrossRef Lane J, Stodden V, Bender S, Nissenbaum H (Hrsg) (2014) Privacy, big data, and the public good * frameworks for engagement. Cambridge University Press, CambridgeCrossRef
Zurück zum Zitat Müller W, Blien U, Knoche P, Wirth H et al (1991) Die faktische Anonymität von Mikrodaten, Bd. 19 der Schriftenreihe Forum der Bundesstatistik, herausgegeben vom Statistischen Bundesamt. Metzler-Poeschel, Stuttgart Müller W, Blien U, Knoche P, Wirth H et al (1991) Die faktische Anonymität von Mikrodaten, Bd. 19 der Schriftenreihe Forum der Bundesstatistik, herausgegeben vom Statistischen Bundesamt. Metzler-Poeschel, Stuttgart
Zurück zum Zitat Ritchie F (2008) Secure access to confidential microdata: Four years of the Virtual Microdata Laboratory. Econ Labour Market Rev 2(5):29–34CrossRef Ritchie F (2008) Secure access to confidential microdata: Four years of the Virtual Microdata Laboratory. Econ Labour Market Rev 2(5):29–34CrossRef
Zurück zum Zitat Schiller D, Welpton R (im Erscheinen): Distributing access to data, not data – providing remote access to European microdata. IASSIST Quarterly Schiller D, Welpton R (im Erscheinen): Distributing access to data, not data – providing remote access to European microdata. IASSIST Quarterly
Zurück zum Zitat Wagner J (1994) Nutzung von Betriebsdaten der amtlichen Statistik für wissenschaftliche Untersuchungen – Ein Modellprojekt. Allgemeines Statistisches Archiv 78(4):434–440 Wagner J (1994) Nutzung von Betriebsdaten der amtlichen Statistik für wissenschaftliche Untersuchungen – Ein Modellprojekt. Allgemeines Statistisches Archiv 78(4):434–440
Metadaten
Titel
Datenzugang in Deutschland: Der Paradigmenwechsel hat bereits stattgefunden
verfasst von
Stefan Bender
Publikationsdatum
01.11.2014
Verlag
Springer Berlin Heidelberg
Erschienen in
AStA Wirtschafts- und Sozialstatistisches Archiv / Ausgabe 4/2014
Print ISSN: 1863-8155
Elektronische ISSN: 1863-8163
DOI
https://doi.org/10.1007/s11943-014-0158-1

Weitere Artikel der Ausgabe 4/2014

AStA Wirtschafts- und Sozialstatistisches Archiv 4/2014 Zur Ausgabe