Skip to main content

2020 | Buch

Qualität bei zusammengeführten Daten

Befragungsdaten, administrative Daten, neue digitale Daten: miteinander besser?

insite
SUCHEN

Über dieses Buch

Die Zusammenführung von Daten aus verschiedenen Quellen eröffnet der akademischen Sozialforschung, der Marktforschung wie auch der amtlichen Statistik vielversprechende Chancen. Das Buch gibt einen Überblick über aktuelle Anwendungen der Datenzusammenführung in den verschiedenen Bereichen sowie über die damit verbundenen Chancen und Risiken.

Inhaltsverzeichnis

Frontmatter
Einführende Bemerkungen
Zusammenfassung
Die folgenden Ausführungen sollen die Ziele und wichtige Funktionen der Zusammenführung von Daten verdeutlichen. Der Begriff der Datenzusammenführung impliziert die Annahme, dass mehrere, möglicherweise aus unterschiedlichen Datenquellen stammende Datenmengen vorliegen, die Ergänzungen voneinander darstellen (vgl. Abbildung 1). In der Regel dürfte zunächst ein Datensatz vorliegen, der aus verschiedenen Gründen durch weitere Daten ergänzt wird.
Frank Faulbaum
Qualität der regionalen Armutsmessung – vom Design zum Modell
Zusammenfassung
Mit dem European Statistics Code of Practice (European Statistical System, 2017) hat das Europäische Statistische System einen Verhaltenskodex verabschiedet, der Standards für Statistiken definiert. Gerade im Zeitalter von Fake News und schnellen Statistiken sind einheitliche und nachvollziehbare Standards in den Statistiken unverzichtbar. Selbstverständlich müssen diese Standards geeignet und vor allem nachvollziehbar umgesetzt werden.
Ralf Münnich
Kleinräumige Prädiktion von Bevölkerungszahlen basierend auf Mobilfunkdaten aus Deutschland
Zusammenfassung
Der Zensus gehört zu den elementaren Konzepten der Bevölkerungsstatistik. Das wichtigste Ziel der Volkszählungen ist dabei die Ermittlung der aktuellen Einwohnerzahl in Deutschland zu einem bestimmten Stichtag (Statistisches Bundesamt 2016). Die Relevanz des Zensus ist dabei für politische und gesellschaftliche Entscheidungen unumstritten.
Sandra Hadam, Timo Schmid, Joanna Simm
Mehr Transparenz und Qualität mit innovativen Small Area Methoden
Zusammenfassung
Der Einsatz von Geodaten und regionalisierten Kennziffern ist im Geomarketing ein Grundbaustein und hilft beispielsweise Unternehmen bei einer optimierten Aussteuerung von Marketingaktivitäten oder Standortplanungen. Seit einigen Jahren steigt aber auch in anderen Disziplinen die Nachfrage nach mikrogeographischen Daten, z.B. als Anreicherung an georeferenzierte Umfragedaten. Damit einher geht u.a. die Fragestellung nach einem möglichen Wirkungszusammenhang zwischen Nachbarschaftskontexten und sozialem Handeln (vgl. Müller 2019, S. 211).
Barbara Wawrzyniak
Datenzusammenführung und integrierte Analysen in Sozialforschung und Marktforschung: Erkenntnis- und Qualitätsgewinn
Zusammenfassung
Die Digitalisierung und die mit den neuen technischen Möglichkeiten einhergehenden Big Data-Entwicklungen haben zu neuen Datenquellen (automatische Verhaltensdaten, Social Media-Daten etc.) auch für Sozialforschung und Marktforschung geführt. Eine selbstverständliche Aufgabe für Marktforscher und Sozialforscher bestand schon immer und besteht erst recht aktuell darin, diese neuen Daten dahingehend zu prüfen, inwieweit sie für die Verhaltens- und Einstellungsmessung verwendbar, vielleicht sogar besser als bisher genutzte Daten verwendbar sind. Eine weitere Aufgabe besteht darin zu prüfen, inwieweit durch Kombination unterschiedlicher Daten ein Qualitätsgewinn der Daten und der daraus abgeleiteten Informationen und/oder ein zusätzlicher Erkenntnisgewinn zu erzielen ist.
Hartmut Scheffler
Qualität bei zusammengeführten Daten
Versuch einer systematischen Annäherung
Zusammenfassung
Amtlichen Statistiken liegt im Regelfall eine einzige Datenquelle zu Grunde. Entweder werden die für die Statistik notwendigen Informationen auf dem Wege einer Primärerhebung gewonnen oder es werden Sekundärdaten – meist Verwaltungsdaten – für die Statistikerstellung genutzt. Inzwischen werden neben Verwaltungsdaten sogenannte Neue Digitale Daten als weitere Sekundärdatenquelle für die Amtliche Statistik verfügbar.
Thorsten Tümmler
Die ADM Transparenz-Initiative
Zusammenfassung
Wenn eine Airline ein neues Flugzeug kauft, dann wird nichts dem Zufall überlassen. Die technischen Daten jeder einzelnen Niete sind von Interesse, umfangreiche Spezifikationshandbücher wechseln die Seiten und die Funktionsfähigkeit jeder Komponente wird unter verschiedensten Bedingungen getestet. Mit gutem Grund: Schon eine Unzulänglichkeit kann im Extremfall Menschenleben kosten, zumindest aber einen teuren Ausfall des Flugzeugs bedeuten. Sicherheit hat in der Luftfahrt mit Abstand höchste Priorität – und Sicherheit basiert auf Vertrauen. Vertrauen braucht schließlich Transparenz.
Sebastian Götte, Bettina Klumpe
Verbindung von Surveydaten und Geodaten
Möglichkeiten, Mehrwert und Probleme am Beispiel des SOEP
Zusammenfassung
In den letzten Jahren sind mehr und mehr Mikrodaten aus Befragungen georeferenziert verfügbar. Dies bedeutet im Allgemeinen, dass der aktuelle Wohnort der tatsächlich befragten und teilweise auch der zu befragenden Haushalte entweder als direkte Gebäudekoordinate oder als Zellenzugehörigkeit innerhalb eines Rasters für die Wissenschaft nutzbar ist. Dies ermöglicht einerseits neue Analysemöglichkeiten, bedarf andererseits aber auch zusätzlicher Vorkehrungen für den Datenschutz.
Jan Goebel
Geokoordinaten als Verknüpfungsmerkmal
Zusammenfassung
Die Nachfrage nach verlässlichen und relevanten (Geo-)Informationen auf immer kleinräumiger Ebene steigt zunehmend, nicht zuletzt aufgrund europäischer und globaler Monitoringaufgaben und Entwicklungsprogramme. Die UN-Agenda 2030 und ihre Ziele für nachhaltige Entwicklung drängen auf eine engere Integration statistischer und geografischer Informationen. Dies stellt einerseits eine Herausforderung für die Statistik und Geographie dar, andererseits eröffnet es eine einzigartige Chance, das Potential und die Wichtigkeit von raumbezogenen statistischen Daten hervorzuheben (Moström et al. 2019).
Hanna Brenzel, Clara Schartner, Kathrin Gebers, Hannes Taubenböck, Michael Wurm
Vergleichbar, passgenau, ganzheitlich
Kunden-Mehrwert durch Datenintegration im Geomarketing
Zusammenfassung
Geodatenprodukte von Anbietern wie der GfK Geomarketing zielen darauf ab, regionale Unterschiede in der soziodemographischen Struktur, dem Konsumverhalten, Produkt- und Markenpräferenzen sowie Werten und Einstellungen der Verbraucher abzubilden oder aber (Handels-)Standorte in ihrer Bedeutung und Qualität zu bewerten. Derartige Produkte werden i.d.R. durch eine geeignete räumliche bzw. algorithmische Verknüpfung von Daten aus öffentlichen und privaten Quellen (kommerzielle Datenanbieter, Anwender/Kunde) und ggf. eigenen Erhebungen generiert.
Hendrik Wagenseil
Record Linkage als zentraler Baustein der Forschung mit Registern und Big Data-Nutzungen
Zusammenfassung
Record Linkage wird häufig mit anderen Techniken verwechselt, z.B. mit „Statistical Matching“ oder Datenfusion. Seltener wird Record Linkage mit einfachem Ergänzen aus anderen Datenbanken durch einen exakten Schlüssel verwechselt (Table Lookup), wobei sich auch das findet. In untechnischen Veröffentlichungen wird gelegentlich der Begriff „fuzzy matching“ verwendet, wobei dieser keine feste Bedeutung besitzt.
Rainer Schnell
Linking Surveys with Big Data
Issues of Consent
Zusammenfassung
Sample surveys are ubiquitously used in the academic, government, and commercial sectors to gain insights about diverse populations. The efficiency of surveys, particularly those that are based on random samples, is in their ability to make robust inferences about a population without needing to interview every single member of that population. The possible inferences extend to all data that is collected during the survey interview, regardless of how many questions are asked of the respondents.
Joseph W. Sakshaug
Backmatter
Metadaten
Titel
Qualität bei zusammengeführten Daten
herausgegeben von
Bettina Klumpe
Dr. Jette Schröder
Markus Zwick
Copyright-Jahr
2020
Electronic ISBN
978-3-658-31009-7
Print ISBN
978-3-658-31008-0
DOI
https://doi.org/10.1007/978-3-658-31009-7