Zum Inhalt

A Case Study Exploring Data Synthesis Strategies on Tabular vs. Aggregated Data Sources for Official Statistics

  • 2024
  • OriginalPaper
  • Buchkapitel
Erschienen in:

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Das Kapitel vertieft sich in den innovativen Bereich der Generierung synthetischer Mikrodaten aus aggregierten Datenquellen und konzentriert sich dabei auf offizielle Statistiken. Es stellt eine Fallstudie vor, die die Leistung der Makro-zu-Mikro-Datensynthese mit herkömmlichen Mikro-zu-Mikro-Methoden vergleicht. Die Autoren schlagen drei verschiedene Szenarien vor - kein Wissen, internes Wissen und externes Wissen - um die Effektivität der Generierung synthetischer Daten zu bewerten. Sie verwenden fortschrittliche Techniken wie Gaußsche Copulas und maschinelle Lernmodelle wie CTGAN und CART, um synthetische Datensätze zu erzeugen. Die Studie bewertet auch die analytische Validität und Offenlegungsrisiken, die mit diesen synthetischen Datensätzen verbunden sind, und bietet wertvolle Einsichten in die Zielkonflikte zwischen Nutzen und Privatsphäre. Das Kapitel schließt mit einer Diskussion über zukünftige Forschungsrichtungen, in der das Potenzial der Synthese von Makro- zu Mikrodaten für Ausbildungs- und Testzwecke hervorgehoben wird.
The views expressed in this paper are those of the authors and do not necessarily reflect the policy of Statistics Netherlands.

Sie sind noch kein Kunde? Dann Informieren Sie sich jetzt über unsere Lizenzmodelle:

Einzelzugang

Starten Sie jetzt Ihren persönlichen Einzelzugang. Erhalten Sie sofortigen Zugriff auf mehr als 170.000 Bücher und 540 Zeitschriften - pdf-Downloads und Neu-Erscheinungen inklusive.

Jetzt ab 54,00 € pro Monat!                                        

Mehr erfahren

Zugang für Unternehmen

Nutzen Sie Springer Professional in Ihrem Unternehmen und geben Sie Ihren Mitarbeitern fundiertes Fachwissen an die Hand. Fordern Sie jetzt Informationen für Firmenzugänge an.

Erleben Sie, wie Springer Professional Sie in Ihrer Arbeit unterstützt!

Beraten lassen
Titel
A Case Study Exploring Data Synthesis Strategies on Tabular vs. Aggregated Data Sources for Official Statistics
Verfasst von
Mohamed Aghaddar
Liu Nuo Su
Manel Slokom
Lucas Barnhoorn
Peter-Paul de Wolf
Copyright-Jahr
2024
DOI
https://doi.org/10.1007/978-3-031-69651-0_28
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
Dieser Inhalt ist nur sichtbar, wenn du eingeloggt bist und die entsprechende Berechtigung hast.
    Bildnachweise
    AvePoint Deutschland GmbH/© AvePoint Deutschland GmbH, ams.solutions GmbH/© ams.solutions GmbH, Wildix/© Wildix, arvato Systems GmbH/© arvato Systems GmbH, Ninox Software GmbH/© Ninox Software GmbH, Nagarro GmbH/© Nagarro GmbH, GWS mbH/© GWS mbH, CELONIS Labs GmbH, USU GmbH/© USU GmbH, G Data CyberDefense/© G Data CyberDefense, Vendosoft/© Vendosoft, Kumavision/© Kumavision, Noriis Network AG/© Noriis Network AG, tts GmbH/© tts GmbH, Asseco Solutions AG/© Asseco Solutions AG, AFB Gemeinnützige GmbH/© AFB Gemeinnützige GmbH, Ferrari electronic AG/© Ferrari electronic AG, Doxee AT GmbH/© Doxee AT GmbH , Haufe Group SE/© Haufe Group SE, NTT Data/© NTT Data, Bild 1 Verspätete Verkaufsaufträge (Sage-Advertorial 3/2026)/© Sage, IT-Director und IT-Mittelstand: Ihre Webinar-Matineen in 2025 und 2026/© amgun | Getty Images