Skip to main content
Erschienen in:
Buchtitelbild

Open Access 2022 | OriginalPaper | Buchkapitel

3. Offene Daten und offene Verwaltungsdaten – Öffnung von Datenbeständen

verfasst von : Jörn von Lucke, Katja Gollasch

Erschienen in: Open Government

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Offene Daten und insbesondere offene Verwaltungsdaten bilden für gelebte Transparenz in Politik und Verwaltung eine wesentliche Grundlage. Im dritten Abschnitt werden daher Begriffsabgrenzungen vorgenommen und Anwendungsgebiete vorgestellt. Im Fokus stehen dabei große Datenbestände, Datenräume, Datenkataloge und Datenportale des öffentlichen Sektors. Ergänzend werden die Potenziale von datenwissenschaftlichen Erkenntnissen vorgestellt.

3.1 Offene Daten

Was lässt sich eigentlich unter dem Begriff „Daten“ verstehen? Und ab wann können diese als „offen“ bezeichnet werden? Um diese Fragen zu klären, thematisiert der folgende Abschnitt zunächst die Herleitung und Definition des Begriffs „offene Daten“ und geht auf praktische Anwendungsbeispiele ein.

3.1.1 Von Daten zu Wissen

Um den abstrakten Begriff „Daten“ einordnen zu können und seine Mehrwerte sichtbar zu machen, bietet sich zur Veranschaulichung die Wissenstreppe nach North an (2002, S. 39). Nach dieser bestehen Daten aus Zeichen, die mit einer Syntax verknüpft sind. Werden diese Daten in einen Bedeutungskontext gestellt, erhält man Informationen. Ist man nun in der Lage, diese Informationen entsprechend zu nutzen, in Bezug zu anderen Informationen zu setzen und zu vernetzen, wird Wissen generiert. Aber erst wenn dieses Wissen mit Anwendungsbezug verknüpft wird, entsteht Können. Nur in Kombination mit Wollen führt das zum Handeln. Das richtige Handeln trägt zum Aufbau von Kompetenzen bei. Wird Einzigartigkeit mit Kompetenzen verknüpft, verbessert sich die Wettbewerbsfähigkeit Abb. 3.1. In Daten stecken daher viele Potenziale, die es zu nutzen gilt. Der Ansatz eines offenen Regierungs- und Verwaltungshandelns setzt darauf, Daten, Informationen und Wissen zu öffnen und zu teilen, um die damit verbundenen Potenziale zu vervielfältigen und gesellschaftliche Mehrwerte zu generieren.

3.1.2 Rohdaten und veredelte Daten

Für den Aufbau und die Verbreitung von Wissen stellen Daten eine wesentliche Grundlage dar. Werden diese unmittelbar aus der erzeugenden Quelle gewonnen und befinden sich noch in einem unverarbeiteten Zustand, wird von Rohdaten gesprochen (Bundesregierung, 2021, S. 116). Rohdaten können beispielsweise Geodaten sein, Kulturdaten (in Form von JPG, PNG, MP3, MP4), Wetter- und Umweltdaten oder Daten aus Wissenschaft und Forschung. Durch die Datenverarbeitung, Bereinigung, Aufbereitung, Strukturierung, Verknüpfung oder Ergänzung erfolgt eine Veredelung von Rohdaten. Gespeichert werden veredelte Rohdaten in Form von Datenbeständen.

3.1.3 Definition und Wirkungen von offenen Daten

Ein wesentlicher Bestandteil von Open Government sind die im Kontext von Transparenz 2.0 bereits erwähnten offenen, frei verfügbaren und standardisierten Daten („Open Data“).
Definition: Offene Daten (Open Data)
Sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden (von Lucke & Geiger, 2010, S. 3.).
Offene Daten können in unterschiedlichen Bereichen zur Verfügung gestellt werden. Dies betrifft Daten zu Politik, Verwaltung und Medien, aber auch Veröffentlichungen und Forschungsergebnisse der Wissenschaft. Unterschiedliche Akteure wie Bürger, Vereine, Verbände, Unternehmen, Verwaltungen, Hochschulen, Forschungsinstitute, Zeitungen und Rundfunksender produzieren offene Beiträge, die auch andere aufgreifen können. Eine Vernetzung offener Daten über das Internet oder andere Datennetzwerke eröffnet die Möglichkeit, diese aus ihrer sektoriellen Isoliertheit zu befreien, über bisherige Domänen- und Organisationsgrenzen hinweg zu verknüpfen und auch komplexe Sachverhalte im Lichte neuer Fakten zu prüfen. Zusammenhänge werden aufgezeigt und durch die Visualisierung von Erkenntnissen können weitere neue Erkenntnisse entstehen (von Lucke, 2019, S. 346).
Im Sinne eines gemeinsamen, von allen geteilten Wissens sollten aber nicht nur die Rohdaten der Verwaltung, sondern auch die auf ihnen basierenden Informationen und Werke für jedermann frei zugänglich gemacht werden. Freie Inhalte (Open Content), also Texte, Bild-, Ton- und Filmwerke in Formaten, die deren Weiterverbreitung, Veränderung und Nutzung zu jeglichem Zweck, auch kommerziell, ohne Zahlung von Lizenzgebühren explizit erlauben, ermöglichen eine rasche Verbreitung von Ergebnissen (von Lucke, 2010, S. 64).
Definition: Vernetzte offene Daten (Linked Open Data)
Sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden und die über das WWW miteinander vernetzt sind (von Lucke & Geiger, 2010, S. 4).
Falls solche Daten komplexe Sachverhalte berühren und ein Potenzial zur Verletzung von Persönlichkeitsrechten oder Geschäftsgeheimnissen in sich tragen, gilt es klare Anforderungen an einen angemessenen Umgang zu formulieren, damit ihre Nutzung wirklich positive und nicht negative Wirkungen verursacht (von Lucke, 2019, S. 346). Offene Daten stellen in einem offenen Regierungs- und Verwaltungshandeln keinen Selbstzweck dar, sondern sollten Transparenz und Zusammenarbeit in der öffentlichen Verwaltung sowie die Partizipation der Zivilgesellschaft aktiv fördern sowie zur Erfüllung öffentlicher Aufgaben beitragen.
Lizenzen zur Regelung des rechtlichen Umgangs mit offenen Daten Quelle: OKF, 2021.
1.
ODC Public Domain Dedication and License (PDDL) (entspricht der CC0/Public Domain) -
Freie Verwendung der Daten. Gilt für allgemein gültige, faktenbasierte Daten, für die es kein Urheberrecht gibt beziehungsweise auf das Urheberrecht verzichtet wird.
 
2.
ODC Attribution License (ODC-BY) (entspricht CC-BY) -
Freie Verwendung der Daten unter Nennung des Urhebers.
 
3.
ODC Open Database License (ODBL) (entspricht CC-BY-SA) -
Freie Verwendung der Daten unter Nennung des Urhebers sowie Bereitstellung der daraus entstandenen Werke unter der gleichen Lizenz.
 

3.1.4 Open Data in der Praxis

In der Praxis finden sich zahlreiche positive Beispiele, wie offene Datenbestände zur Verfügung gestellt und genutzt werden können. Das Organized Crime and Corruption Reporting Project (2021) ist eine frei zugängliche Datenbank für Journalisten, die hier Informationen für ihre investigative Recherche finden, um Korruption und andere kriminelle Machenschaften aufzudecken (OCCRP, 2021). Die offene Unternehmensdatenbank Open Corporates (2021) bietet einen Zugriff auf Daten von 192 Millionen Unternehmen weltweit. Sie kann für die Recherche von zukünftigen Arbeitsgebern oder Handelspartnern genutzt werden. Die Open Ownership (2021) setzt Standards zur Kenntlichmachung der tatsächlichen Eigentumsverhältnisse von privatwirtschaftlichen Unternehmen. Aber auch in Deutschland gibt es erstrebenswerte Ansätze im Bereich der offenen Daten, insbesondere im Bereich der Mobilität. Dazu zählt die mcloud (2021), die Datenbestände aus den Bereichen Verkehr, Klima und Wetter, Luft- und Raumfahrt sowie Infrastruktur zur Verfügung stellt. Ein weiteres Beispiel ist das Open Data Portal (2021) der Deutschen Bahn AG, die als öffentliches Unternehmen Datenbestände rund um Infrastruktur und Mobilität zur Verfügung stellt. Wie Verwaltung, Wirtschaft und Zivilgesellschaft bei der Nutzung von Daten des Nahverkehrs zusammenwirken können, zeigt das Projekt Apps & the City (2021). Auf Basis offener Daten wurden hier seit 2012 verschiedene Anwendungen entwickelt, die die Nutzung von öffentlichen Verkehrsmitteln erleichtern. Zudem gibt es Organisationen und Vereine, die sich auf die Nutzung von (offenen) Daten spezialisiert haben. Darunter befindet sich beispielsweise das Netzwerk Correlaid (2021), das unter anderem Datenkompetenzen an zivilgesellschaftlichen Akteuren vermittelt. Das Potenzial offener Daten wird auch im privatwirtschaftlichen Bereich erkannt und genutzt. Beispielsweise werden im Tourismusbereich offene Daten über Open Data Destination Germany (2021) zur Verfügung gestellt, um die Wettbewerbsfähigkeit des Tourismusstandort Deutschlands nachhaltig zu stärken. Die erfolgreiche Vernetzung von Akteuren im Open-Data Bereich ist von großer Relevanz, wenn es darum geht, die wirtschaftlichen Potenziale von offenen Daten zu heben. Mit dem Ziel, die digitale Wirtschaftspolitik länderübergreifend durch Open Data zu stärken und Open-Data-Startups global zu vernetzen, wurde 2012 in London das Open Data Institute (2021) gegründet, dass seitdem Unternehmen und Existenzgründer zusammenbringt, um Lösungen für gesellschaftliche Herausforderungen auf Basis offener Daten zu finden. Zur Vernetzung der Open Data Community trägt ebenso der jährliche Open Data Day (2021) bei.

3.2 Offene Verwaltungsdaten

Offene Verwaltungsdaten sind ein relevanter Teilbereich der offenen Daten. Im Kontext von Open Government sind diese besonders relevant, da sie den öffentlichen Sektor und dessen Aufgabenerfüllung transparenter gestalten können.

3.2.1 Paradigmenwechseln in Staat und Verwaltung

Open Government und die damit verbundenen Ansprüche an offene Daten stellen den öffentlichen Sektor in Deutschland vor große Herausforderungen. Um diesen gerecht zu werden, bedarf es eines dreifachen Paradigmenwechsels von Staat und Verwaltung hin zu einer neuen öffentlichen und offenen politischen und administrativen Kultur (IG Collaboratory, 2010, S. 54 f.): Das erste Paradigma betrifft das Konzept von Öffentlichkeit und Geheimhaltung in Bezug auf Daten. Nach dem alten Paradigma ist alles geheim, was nicht ausdrücklich als öffentlich gekennzeichnet ist. Das neue Paradigma kehrt diesen Grundsatz um. Demnach sollte alles öffentlich sein, was nicht ausdrücklich als geheim gekennzeichnet ist. Das zweite Paradigma betrifft Umfang, Art und den Zeitpunkt der Veröffentlichung von Daten. Dem alten Paradigma zufolge werden Umfang und Zeitpunkt der Veröffentlichung von den einzelnen Behörden selbst bestimmt. Oft erfolgt eine Akteneinsicht erst nach einer Anfrage, etwa auf Grundlage des Informationsfreiheitsgesetzes des Bundes oder, falls vorhanden, des Landes. Das neue Paradigma besteht darin, alle Daten, die keiner berechtigten Datenschutz- oder Sicherheitsbeschränkung unterliegen, proaktiv, im vollen Umfang und zeitnah zu veröffentlichen. Das dritte Paradigma betrifft die Nutzungsrechte an den veröffentlichten Daten. Nach dem alten Paradigma werden veröffentlichte Daten für den privaten Gebrauch nur zur Einsicht freigegeben. Alle weiteren Nutzungsrechte sind vorbehalten und können von Fall zu Fall gewährt werden. Im Sinne eines neuen Paradigmas, sollen veröffentlichte Daten grundsätzlich von jedermann für jegliche Zwecke, auch kommerzielle, ohne Einschränkungen kostenfrei nutzbar sein. Das umfasst ausdrücklich das Recht der Weiterverarbeitung und Weiterverbreitung der Daten. Dieser aufgeführte Paradigmenwechsel bedeutet einen grundlegenden Kulturwandel für Staat und Verwaltung. In Hinblick auf seine vielfältigen Mehrwerte im Bereich Transparenz, demokratische Kontrollrechte der Bürger, Wissenstransfer und Innovationsprozesse im öffentlichen Sektor, sollte er schrittweise umgesetzt werden (von Lucke & Geiger, 2010, S. 7–8).

3.2.2 Definition und Wirkungen von offenen Verwaltungsdaten

Offene Verwaltungsdaten finden sich in einer Schnittmenge der Bereiche Daten, Offenheit und Verwaltung Abb. 3.2.
Auf Basis der Definition von offenen Daten Abschn. 3.1.3, lassen sich offene Verwaltungsdaten wie folgt definieren:
Definition: Offene Verwaltungsdaten (Open Gov Data)
Sämtliche Datenbestände des öffentlichen Sektors, die von Staat und Verwaltung im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.
Wenn diese Daten zusätzlich über das Internet vernetzt sind, wird von vernetzten offenen Verwaltungsdaten beziehungsweise Linked Open Gov Data (LOGD) gesprochen (von Lucke & Geiger, 2010, S. 3 f.).
Offene Verwaltungsdaten schließen explizit all jene Bestände aus, deren Veröffentlichungen untersagt sind, etwa bei Geheimhaltungspflichten, bei personenbezogenen Daten sowie bei Betriebs- und Geschäftsgeheimnissen. Werden die ausgewählten offenen Datenbestände strukturiert und maschinenlesbar von den zuständigen Behörden proaktiv bereitgestellt, lassen sie sich mit reduziertem Aufwand und von mehreren Nutzern gleichzeitig automatisiert durchsehen, durchsuchen, filtern, aufbereiten, überwachen und weiterverarbeiten. Hier ergeben sich vielfältige Innovationsimpulse durch die mögliche Entwicklung von datenbasierten Apps, datenbasierten Karten- und Navigationsdiensten und übergreifend angelegten Suchmaschinen. Das Durchstöbern von Datenbeständen mit dem Browser, die in verteilten Datenbanken hinterlegt und über Hyperlinks und Suchmaschinen gefunden werden, bieten viele Möglichkeiten für Zivilgesellschaft, Staat und Verwaltung, ebenso wie die Realisierung von digitalen Zwillingen der Städte. Konkret geht es hier im engeren Sinne um Datenbestände wie etwa statistische Daten, Geodaten, Umwelt -und Wetterdaten und Haushaltsdaten und im weiteren Sinne auch um aufbereitete Informationsbeiträge wie etwa Statistiken, Karten, Materialien der Parlamente, Ministerien und Behörden, Gesetze, Verordnungen, Satzungen und richterliche Entscheidungen (von Lucke, 2019, S. 346–347).

3.2.3 Gesetzliche Grundlagen

In Deutschland kamen bereits 2009 erste Diskussionen zu möglichen gesetzlichen Grundlagen hinsichtlich des Umgangs mit Verwaltungsdaten und deren Öffnung auf. Auf Bundesebene wurde 2017 das E-Government-Gesetz (EGovG) erweitert. Der neue § 12a EGovG regelt den Umgang mit offenen Daten. Dies wurde mit dem ersten deutschen Open-Data-Gesetz so etabliert. Dadurch müssen Ministerien der Bundesverwaltung unbearbeitete Verwaltungsdaten nach dem Prinzip „Open by Default“ über das nationale Datenportal GovData (2021) zur Verfügung stellen. Grundsätzlich haben jedoch Spezialgesetze Vorrang. Das Open-Data-Gesetz wurde im Sommer 2021 mit einem zweiten Open-Data-Gesetz erneut geändert. Eine wesentliche Änderung war zum einen die Bereitstellungspflicht der Daten in maschinenlesbarer Form, um die Datenweiterverwendung und -nutzung zu erleichtern. Zudem wurde der Kreis der Datenbereitsteller neben allen Behörden der Bundesverwaltung auch auf Anstalten und Körperschaften des öffentlichen Rechts erweitert. Ebenso wurde eine Streichung des Ausnahmetatbestands für Forschungsdaten vorgenommen. Ein neuer Bestandteil ist die Ernennung von Open-Data-Koordinatoren, die als zentrale Beratungs- und Ansprechperson für die Identifizierung, Bereitstellung und Nutzung offener Daten sowie die Durchsetzung der Open Data Ziele des Bundes fungieren. Zudem wurde das Datennutzungsgesetz (DNG) verabschiedet, mit dem die europäische Richtlinie (EU) 2019/1024 (PSI-Richtlinie) in deutsches Recht umgesetzt wird. Es löst damit das Informationsweiterverwendungsgesetz ab. Durch das DNG werden einheitliche, nichtdiskriminierende Nutzungsbedingungen für Daten des öffentlichen Sektors festgelegt. Zudem soll es zur erleichterten Entwicklung von KI-Diensten auf der Grundlage maschinenlesbarer Daten beitragen. Allen Akteuren des europäischen Binnenmarktes werden die gleichen Nutzungsbedingungen der Daten zur Verfügung gestellt. Neben dem öffentlichen Sektor wurde auch hier die Ausweitung auf öffentliche Unternehmen vorgenommen, sodass auch hier eine Verbreitung der Nutzung und Anwendung offener Daten angestrebt wird.

3.2.4 Professionelle Bereitstellung

Zehn Prinzipien zur Offenlegung von Daten
Für eine professionelle Bereitstellung von offenen (Verwaltungs-) Daten gilt es einige Anforderungen zu beachten, die diese erfüllen sollten. Zehn grundlegende Prinzipien offener Regierungsinformationen fasste die Sunlight Foundation (2010) zusammen: Bei den von Regierung und Verwaltung veröffentlichten Datensätzen wird Vollständigkeit erwartet. Sie sollten Primärquellen sein und der Öffentlichkeit innerhalb eines angemessenen Zeitraums zur Verfügung stehen (zeitliche Nähe). Ein leichter Zugang soll sie so zugänglich wie möglich machen. Eine Speicherung der Daten und Informationen in etablierten und zugleich leicht maschinenlesbaren Dateiformaten wäre wünschenswert (Maschinenlesbarkeit). Ein diskriminierungsfreier Zugang bedeutet einen Zugriff auf die Daten für jedermann und zu jeder Zeit, ohne sich identifizieren oder eine Rechtfertigung für das Handeln abgeben zu müssen (Diskriminierungsfreiheit). Die Forderung nach der Nutzung gemeinsam entwickelter offener Standards bezieht sich auf die Verwendung kostenlos verfügbarer Formate, durch die ohne Nutzung einer Software-Lizenz auf die Daten zugegriffen werden kann. Maximale Offenheit bedeutet, dass öffentliche Daten und Informationen klar als Werk des öffentlichen Sektors auszuweisen sind und dass sie ohne Nutzungsbeschränkungen gemeinfrei verfügbar gemacht und dies in einer Lizenz (Lizenzierung) hinterlegt wird. Daten und Informationen sollen über lange Zeit hinweg zu finden und daher in Archiven dauerhaft online verfügbar bleiben (Dauerhaftigkeit). Beim Zugriff auf öffentlich verfügbare Daten und Informationen sollten die Kosten so minimal wie möglich sein.
Vorbildhafte Beispiele in der Praxis
In der Praxis gibt es einige nennenswerte Anleitungen, die Akteuren eine Hilfestellung für die professionelle Bereitstellung von offenen Daten geben. Der vom Bundesverwaltungsamt (BVA) veröffentliche Leitfaden fasst wesentliche Anforderungen an Daten zusammen (BVA, 2018). Ebenso gibt das Fraunhofer-Institut FOKUS in seinem Leitfaden einen Überblick über Qualitätsmerkmale von Daten und zeigt konkrete Handlungsempfehlungen auf (Bruns et al., 2019). Das Handbuch des Kompetenzzentrum Open Data (CCOD) im Bundesverwaltungsamt thematisiert die Entwicklung von Open-Data-Konzepten als auch die konkrete Umsetzung (BVA, 2020). Insbesondere wird auf die Etablierung eines Open-Data-Lebenszyklus eingegangen.
Wenn Daten bereitgestellt werden sollen, kann dies durch unterschiedliche Lizenzen geschehen. In einer Zusammenarbeit von Bund, Ländern und kommunalen Spitzenverbänden wurde die Datenlizenz Deutschland entwickelt. Seitdem regeln zwei Versionen der Lizenz die einheitlichen Nutzungsbestimmungen für Verwaltungsdaten in Deutschland. Unter der Version dl-de/by-2-0 werden Nutzer der Daten verpflichtet, den jeweiligen Datenbereitsteller zu nennen. Die Version dl-de/zero-2-0 ermöglicht eine einschränkungslose Weiterverwendung der Daten. Die Lizenzen sind vollständig an den deutschen Rechtsraum angepasst. Jedoch wurden die Lizenzen aufgrund der fehlenden weltweiten Anwendbarkeit von der Open-Data-Community kritisiert. In einem rechtlichen Kurzgutachten des Ministeriums für Wirtschaft, Innovation, Digitalisierung und Energie des Landes Nordrhein-Westfalen wurde daher untersucht, ob die Verwendung und Weiterentwicklung der Datenlizenz Deutschland 2.0 sinnvoll ist oder zukünftig grundsätzlich auf andere Lizenzen, etwa der Creative Commons Initiative, abgestellt werden soll (MWIDE NRW, 2019). Weltweit wird eher auf die Verwendung der Creative Common Lizenzen sowie der Open Data Commons Lizenzen gesetzt.

3.2.5 Open Government Data in der Praxis

Was sind nun konkrete Beispiele für offene Verwaltungsdaten und wo finden sie in der Praxis Anwendung? Verwaltungsdaten können beispielsweise statistische Daten, Geodaten, Umweltdaten, Wetterdaten, Haushaltsdaten, Forschungsdaten oder Verkehrsdaten sein. Wenn diese Daten bearbeitet und veredelt werden, ist es möglich sie in unterschiedlichen Formaten zur Verfügung zu stellen. Beispielsweise werden sie dann als Karten, Pläne, Gesetze, Verordnungen, Satzungen, richterliche Entscheidungen oder Publikationen bereitgestellt. Deutschlandweit finden sich zahlreiche Ansätze, wie offene Verwaltungsdaten bereits genutzt werden. Beispielsweise gibt der Unfallatlas (2021) der statistischen Ämter eine deutschlandweite, kartenbasierte Übersicht aller Unfälle und kann so in Stadtplanungsprojekten eine wesentliche Hilfe für die sichere Verkehrsführung darstellen. Über Open Legal Data (2021) wird ein freier Zugang zu juristischen Informationen, wie Gesetzestexten und Urteilen, kostenlos und maschinenlesbar zur Verfügung gestellt. Um Ratsinformationssysteme offen zu machen, hat die Open Knowledge Foundation zusammen mit OParl die Plattform Politik bei uns (2021) gegründet. Öffentliche Daten der jeweiligen Kommunen lassen sich so abrufen und (grafisch) aufbereiten. Die Stadt Ulm zeigt kartenbasierte Informationen im Mobilitätsbereich unter dem Namen ulmrouting (2021) auf. Der Musterdatenkatalog der Bertelsmann Stiftung schafft eine gute Übersicht, welche offenen Verwaltungsdaten bisher von Kommunen bereitgestellt werden (BS, 2020) und stellt zudem in einem Leitfaden eine Schritt-für-Schritt-Anleitung bereit (Krabina, 2020). In Zusammenarbeit mit der Stadt Wien hat das KDZ – Zentrum für Verwaltungsforschung ein Vorgehensmodell für die Implementierung von Open-Government-Initiativen entwickelt. Dieses zeigt Möglichkeiten auf, wie Open Government ganzheitlich umgesetzt werden kann (Krabina, 2016). Das sind nur einige Ansätze für die Verwendung von offenen Verwaltungsdaten. Letzten Endes geht es hier um die Frage, wie darauf aufbauend neue Geschäfts- und Politikfelder ermöglicht und erschlossen werden können. Wie kann auf Basis von offenen Transportdaten die Mobilitätswende erreicht werden? Wie lassen sich auf Basis von offenen Umweltdaten die Herausforderungen des Klimawandels bewältigen? Eine internationale Vernetzung ist dafür wesentlich. Das Netzwerk OGD DACHLI & OGD Cooperation (2022) fokussiert beispielswiese den Austausch im deutschsprachigen Raum. Jedoch muss auch europaweit und international verstärkt der Austausch gelebt werden, um gegenseitig voneinander lernen zu können.

3.2.6 Geschäftsfeldentwicklung rund um offene Daten

Zwar mag es für viele Behörden herausfordernd sein, offene Daten zu finden, zu erschließen und dauerhaft bereitzustellen. Tatsächlich endet die öffentliche Aufgabe aber nicht mit der reinen Veröffentlichung der Daten. Vielmehr muss sichergestellt werden, dass die offenen Datenbestände im Alltag von Politik, Verwaltung, Wirtschaft, Wissenschaft und Gesellschaft auch genutzt werden und zugleich als Grundlage etwa für eine offene Verkehrspolitik, eine offene Gesundheitspolitik oder eine offene Forschungspolitik dienen. Insofern liegt die größte Herausforderung für die öffentliche Verwaltung in der Geschäftsfeldentwicklung um offene Datenbestände aus staatlicher Sicht. Gemeinsam mit Wirtschaft, Wissenschaft, Künstlern und der Bevölkerung gilt es das wirtschaftliche, gesellschaftliche, politische und kulturelle Potenzial offener Daten prosperierend zu erschließen sowie zu großen und intelligent vernetzten Datenbeständen weiterzuentwickeln (von Lucke & OGD DACHLI, 2017, S. 11).
Bisher unbekannte Zusammenhänge und Sachverhalte können zum öffentlichen Diskurs anregen und zu neuartigen Lösungsansätzen animieren. Hierzu eignen sich koordinierende Stellen mit angeschlossenen Inkubatoren, die über offene Treffen zur gemeinsamen Marktentwicklung einladen sowie Existenzgründer und Sozialunternehmer professionell beim Aufbau ihrer Open Data-Geschäftsmodelle begleiten. Aus diesen Treffen können festere Strukturen, regionale Netzwerke und Forschungsverbünde entstehen, die zur Datenmarktentwicklung und regionalen Problemlösung beitragen. Eine gezielte staatliche Förderung von Startups und Sozialunternehmern, die sich mit verwaltungsnahen Datenbestände und Apps beschäftigen, wäre überall dort wünschenswert, wo öffentliche Aufgaben dadurch effizienter und effektiver als auf die herkömmliche Art und Weise wahrgenommen werden können. Zudem besteht die Möglichkeit über datenbasierte soziale Geschäftsmodelle gesellschaftlichen Mehrwert zu generieren. Parallel ist eine enge Zusammenarbeit mit der Wirtschaftsförderung anzustreben, denn diese führt über die Mentoren, Erfahrungen und Netzwerke zur erfolgreichen Existenzgründung. Geschäftsfeldentwicklung bedeutet auch, den praktischen Nutzen und die Potenziale vorhandener Datenbestände aufzuzeigen sowie neue Formate der Zusammenarbeit zu entwickeln und zu etablieren (von Lucke & OGD DACHLI, 2017, S. 11).

3.3 Große Datenbestände des öffentlichen Sektors

Mit der zunehmenden Digitalisierung von Staat und Verwaltung wird eine immer größere und komplexere Anzahl an Datensätzen für den öffentlichen Sektor produziert. Welche Datenbestände dies sind, wie sie genutzt werden und wo künftige Herausforderungen liegen, soll in diesem Abschnitt thematisiert werden.

3.3.1 Große Datenbestände: Big Datasets

Definition: Big Data
Besonders große und komplexe Datenmengen, die oft aus heterogenen Datenquellen bestehen und deren Datenvolumen im Bereich von Petabytes, Exabytes und Zettabytes liegt.
Konkret zeichnen sich diese großen Datenbestände durch die fünf folgenden V-Kriterien aus. Volume: Es handelt sich um eine große Masse an Daten, die keine Grenzen kennt. Variety: Die Datenbestände beinhalten eine Vielfalt von Datentypen und Datenquellen. Velocity: Die Datenverarbeitung und Datenanalyse erfolgen in Echtzeit. Veracity: Die Zuverlässigkeit und Qualität der Daten werden gewährleistet. Value: Die Daten besitzen eine hohe Relevanz.
Im öffentlichen Sektor findet sich die praktische Anwendung großer Datenbestände in den folgenden Bereichen: Daten aus Haushaltswesen und Ausschreibungswesen, statistische Daten und Datenbestände von Registern, Telekommunikationsvorratsdaten und Social Media, Energieverbrauchs- und Mobilitätsdaten, Wetterdaten, Geobasisdaten und Geofachdaten, Medien der Mediatheken des öffentlich-rechtlichen Rundfunks und Forschungsdaten der Lebenswissenschaften (in Anlehnung an Bundesregierung, 2021, S. 105).
Data Mining und Social Media Mining
Nun stellt sich die Frage, wie sich diese Daten nutzen und auswerten lassen. Zwei Ansätze aus der Wirtschaftsinformatik sind hier relevant. Der erste Ansatz liegt im Data Mining, indem statistische Verfahren auf in digitaler Form vorliegende Daten wie Texte, Töne oder Bilder angewandt werden, um einen Erkenntnisgewinn zu erlangen und Trends vorhersagen zu können.
Der zweite Ansatz ist das Social Media Mining, bei dem auf die Gewinnung von Erkenntnissen aus nutzergenerierten Inhalten auf Social-Media-Plattformen und mobilen Apps gesetzt wird. Dabei wird durch die Erkennung von Mustern das Nutzerverhalten analysiert und ausgewertet. Anwendungsfelder für Social Media Mining gibt es zahlreiche, wie die Gesellschaft für Informatik bereits im Jahr 2012 analysierte. Dies umfasst ein intelligentes Monitoring über Akteursanalysen, Meinungsanalysen oder Trendanalysen. Ebenso gehört Reputationsmanagement dazu, also die Beeinflussung der Reputation von Personen durch gezielte Beiträge oder Bewertungen im Social Media Bereich, was für Personen der Öffentlichkeit wie Politiker von besonderer Relevanz ist. Darüber hinaus können Ziel- und Nutzergruppen von Inhalten analysiert werden, auf dessen Basis Produkte und Werbung entwickelt und verbessert werden können. Im sozialwissenschaftlichen Bereich eröffnen sich neue Bereiche für die Durchführung von Forschungsarbeiten (GI, 2012).
Hochwertige Einsatzfelder: High Value Datasets
Das BMWi hat zusammen mit Fraunhofer FOKUS und dem Institut der deutschen Wirtschaft Köln e.V. analysiert, welche Datensätze für den öffentlichen Sektor von besonders hoher Bedeutung sind, also ein besonders hohes Potenzial in ökonomischer, ökologischer und gesellschaftlicher Hinsicht aufweisen. Laut der Studie Hochwertige Datensätze in Deutschland sind für den öffentlichen Bereich insbesondere Daten des Georaumes, der Erdbeobachtung und der Umwelt, der Meteorologie, der Statistik, der Unternehmen und ihrer Eigentümerschaft sowie der Bereich Mobilität relevant (BMWi, 2021).
Vernetzte Datenbestände: Linked Data
Durch die Vernetzung von Datenbeständen ergeben sich zahlreiche Potenziale. Beispielsweise lassen sich auf Basis von offenen vernetzten Daten (LOD) und offenen Schnittstellen (APIs) Anwendungen (Apps, Software), Werkzeuge (Tools) und Online-Dienste (Cloud Computing) erstellen, die automatisiert Recherchen, Visualisierungen, Analysen, Überwachung und Berichterstattung unterstützen (von Lucke & Geiger, 2010, S. 4). Dabei gilt es auch hier Qualitätsmerkmale zu berücksichtigen. Berners-Lee definierte 2010 fünf Stufen, mit denen die Qualität von vernetzten Daten bewertet werden könne. Die erste Stufe besteht darin, Daten im Web unter einer offenen Lizenz überhaupt bereitzustellen. Auf der zweiten Stufe werden die Daten in einem strukturierten Format verfügbar gemacht (beispielsweise in einer Excel-Tabelle). Die dritte Stufe bedeutet zusätzlich offene, nicht proprietäre Formate (zum Beispiel CSV statt Excel) zu verwenden. Auf der vierten Stufe werden URIs zur Verlinkung der Daten genutzt. Die fünfte und letzte Stufe besteht darin eigene Daten mit anderen Daten zu verknüpfen, um neue Ergebnisse zu generieren (FiveStarData, 2021).

3.3.2 Herausforderungen: Datenschutz und Datenqualität

Datenschutz und Analysen
Bei der Offenlegung von Daten beschreiten Staat und Verwaltung auch neuartige Pfade, mit denen sie sich teilweise in bisher unstrukturierten, unterregulierten Räumen sowie rechtsfreien Sphären bewegen werden. Daher sollten einige wesentliche Kriterien im Bereich des Datenschutzes beachtet werden. Bevor Daten frei zur Verfügung gestellt werden, muss geprüft werden, ob Ausnahmetatbestände zutreffen, die gegen eine Veröffentlichung sprechen. Dies ist der Fall, wenn kein oder nur ein eingeschränktes Zugangsrecht zu den Daten besteht oder, wenn Daten gemäß des IFG von einer Veröffentlichung ausgeschlossen sind wie bei Daten mit Personenbezug oder Amts-, Dienst-, aber auch Betriebs- und Geschäftsgeheimnisse. Ebenso dürfen keine Daten veröffentlicht werden, wenn die notwendige Freigabe von Dritten nicht erfolgt oder die Daten ohne Auftrag der Behörde von Dritten erstellt und ohne rechtliche Verpflichtung übermittelt wurden. Zur Vermeidung von Doppelarbeit sollten keine Daten bereitgestellt werden, die bereits als offene Daten in öffentlich zugänglichen Netzen entgeltfrei zur Verfügung stehen. Vor einer Veröffentlichung muss geprüft werden, ob Datenschutzanforderungen eingehalten werden. Bei Anschaffung neuer Fachverfahren sollte auf „Open by Design“ und die Vermeidung von Personenbeziehbarkeit gesetzt werden. Auch muss durch Anonymisierung oder Pseudonymisierung der Inhalte eine Personenbeziehbarkeit ausgeschlossen werden (BVA, 2020, S. 60 f.).
Datenethikkonzept der Stadt Ulm
Um sich im Vorhinein über die Folgen der Offenlegung von Daten bewusst zu sein sowie den Umgang mit Daten eindeutig zu regeln, empfiehlt sich die Entwicklung eines Datenethikkonzepts. Dies liefert umsetzbare ethische Leitlinien für das Programmieren intelligenter Maschinen sowie für den Einsatz und die Nutzung von IT-Systemen, Anwendungen und Daten, die von Experten nach einer ethischen Reflexion von Technik abgesteckt wurden. So hat sich die vom BMBF geförderte Zukunftsstadt Ulm mit Bürgern und Wissenschaft ein kommunales Datenethikkonzept erarbeitet. Das dortige klare Bekenntnis zu Datenschutz und IT-Sicherheit, zur Bereitstellung und Weitergabe offener Daten, zu digitaler Souveränität, Bürgerbeteiligung und demokratischer Kontrolle, einem transparenten Umgang mit Daten, Algorithmen und automatisierten Systemen sowie zu Gemeinwohlverpflichtung, Nachhaltigkeit und sozialer Verantwortung dient allen Beteiligten als Orientierung und als Leitplanke. Diese Leitlinien zum Umgang mit städtischen Daten tragen dazu bei, dass die Ulmer Bürger ihrer Stadt sowohl bei der Öffnung ihrer Datenbestände als auch der weiteren Digitalisierung der Stadt voll vertrauen können (von Lucke et al., 2021, S. 383–392; Stadt Ulm 2020).
Datenqualität und Datenexzellenz
Im Kontext von Datenmanagement spielen Datenqualität und Datenexzellenz wesentliche Rollen. Um eine hohe Qualität zu erreichen, müssen Daten vollständig, mit zeitlicher Nähe, hoher Genauigkeit und fehlerlos veröffentlicht werden. Weiterhin zählen Plausibilität, Konsistenz, Integrität und Richtigkeit zu den wesentlichen Kriterien. In diesem Zusammenhang gibt es von Go Fair eine Zusammenstellung der FAIR-Data-Prinzipien:
Hintergrundinformationen (GoFair, 2021)
  • Findable (Auffindbar): Daten müssen auffindbar sein, vor allem durch eine vollständige Metadatenbeschreibung und persistente Identifikatoren.
  • Accessible (Zugänglich): Zugänglichkeit muss gewährleistet sein, unter anderem durch klare Autorisierungs- und Authentifizierungsregeln für den Datenzugriff sowie die Verwendung offener Protokolle für die Datenübertragung.
  • Interoperable (Interoperabel): Daten müssen interoperabel und kombinierbar sein, vor allem durch die Verwendung interoperabler Vokabulare und Schemata zur Wissensrepräsentation.
  • Reusable (Wiederverwendbar): Daten müssen weiterverwendbar sein, unter anderem durch die Einhaltung domänen- beziehungsweise communityspezifischer Standards sowie die Angabe klarer Provenienz- und (nicht zwangsläufig offener) Lizenzinformationen.

3.3.3 Aufbau einer Open Data Kultur

Ziel von offenen Verwaltungsdaten muss es sein, den Aufbau einer Open-Data-Kultur zu fördern. Doch welche Maßnahmen gehören hier dazu? Im Bereich der binnenwirksamen Maßnahmen ist eine gemeinsame Wissensbasis und Referenzsammlungen essenziell. Zusätzlich müssen verwaltungsinterne Zielgruppen angesprochen und von den Mehrwerten überzeugt werden. Der fachliche Austausch ist ebenso wichtig wie die Auszeichnung und Anerkennung für besonders innovative Vorschläge. Vorgaben müssen eine steuernde und regulierende Wirkung haben und ebenso sollte auf die verwaltungsinterne Weiterbildung eingezahlt werden (von Lucke & OGD DACHLI, 2017, S. 4 ff.). Zu den außenwirksamen Maßnahmen gehört es, ein interdisziplinäres wissenschaftliches Fundament bereitzustellen, die Standardisierung der Veröffentlichung von Verwaltungsdaten voranzutreiben und eine Geschäftsfeldentwicklung um offene Datenbestände aus staatlicher Sicht anzustreben. Ebenso müssen vernetzende öffentliche Veranstaltungen (wie Entwicklertage) sowie Ideen- und Umsetzungswettbewerbe genutzt werden, um neue Innovationen zu generieren (von Lucke & OGD DACHLI, 2017, S. 6 ff.).

3.4 Urbane Datenräume

Im öffentlichen Sektor kommt es immer mehr zum Aufbau und zur Nutzung von Datenräumen. Dieser Abschnitt erklärt, was (urbane) Datenräume sind und welche Entwicklungen die europäische Union in diesem Bereich forciert.

3.4.1 Datenräume und Industrie-Datenräume

Datenräume sind gemeinsame, vertrauenswürdige Räume für Transaktionen mit Daten. Sie basieren auf gemeinsamen Standards, Werten, Technologien und Schnittstellen, die Transaktionen mit Daten erlauben oder befördern (Bundesregierung, 2021, S. 109). Damit handelt es sich um ein Architekturmodell zur Datenintegration. Es zeichnet sich durch eine verteilte Datenhaltung verschiedener Datenquellen und den Verzicht auf ein gemeinsames semantisches Modell aus (Fraunhofer, 2016, S. 38). Dies eröffnet neue Wege zu innovativen datenbasierten Dienstleistungen unter gleichzeitiger Gewährleistung von Datenschutz und Datensicherheit.
Das zugrunde liegende Konzept wurde von der Fraunhofer Gesellschaft erstmals im Kontext von Industrie 4.0 als intelligente Dateninfrastruktur für die Wirtschaft skizziert (Fraunhofer, 2016). Ein solcher Industrie-Datenraum bietet eine wichtige Grundlage zur Digitalisierung und Vernetzung der industriellen Produktion auf der Basis von Informationstechnologien. Dies ermöglicht eine intelligente Verzahnung von Wertschöpfungsketten und damit eine weitgehende Selbstorganisation auf Basis einer Vernetzung von Menschen, Maschinen, Anlagen, Logistik und Produkten (BMBF, 2020).
Datenräume eröffnen vielfältige Einsatzmöglichkeiten. So lassen sich etwa zu allen realen Objekten, Artefakten, Personen und Prozessen sogenannte digitale Zwillinge erschaffen. Dies sind virtuelle Modelle eines Objektes, eines Prozesses, eines Produkts oder einer Dienstleistung, mit denen die reale und die virtuelle Welt verbunden werden. Sie können virtuelle digitale Repräsentanten von physischen Objekten sein, als Simulationsmodell für Analysen dienen, als Monitor für smarte Daten von physischen Objekten herhalten oder zur Steuerung physischer smarter Objekte verwendet werden (Gabler Wirtschaftslexikon, 2021). Im öffentlichen Sektor eröffnet dies Einsatzmöglichkeiten zur Stadtplanung, zum Bauen, zum Gebäudemanagement, zur Verkehrslenkung und zum geobasierten Controlling. Vorreiter in der raumbezogenen Nutzung digitaler Zwillinge im öffentlichen Sektor sind die Städte Zürich und Wien, die Stadt Herrenberg, die Stadt München, die Freie und Hansestadt Hamburg und die Stadt Leipzig.

3.4.2 Urbane Datenräume

Urbane Daten sind alle Arten von Daten, die im urbanen Kontext wichtig sind, unabhängig von der konkreten Datenlokalisation, der Datenhaltung, den darauf liegenden Schutzrechten und lizenzrechtlichen Anforderungen. Sie können auch Daten umfassen, die über den direkten urbanen oder kommunalen Kontext hinausreichen.
Als urbaner Datenraum wird der Raum bezeichnet, in dem urbane Daten erzeugt und verarbeitet werden. Damit bezieht sich das Verständnis auf die Gesamtheit aller Daten, die in einem urbanen Kontext eine wirtschaftliche, städtebauliche, geografische, technische, klimatische, gesundheitliche oder anderweitige Bedeutung haben und die in diesem Raum generiert, gesammelt oder in kommunalen Prozessen benötigt werden. Dazu zählen etwa amtliche Daten und Unternehmensdaten, Forschungsdaten, personenbezogene Daten und verhaltensgenerierte Daten (Fraunhofer FOKUS et al., 2018, S. 219).
Inhaltlich setzen sich urbane Datenräume aus frei verfügbaren urbanen Daten, kommerziell verfügbaren urbanen Daten und internen urbanen Daten zusammen. Frei verfügbare urbane Daten, häufig in Open-Data-Formaten mit entsprechender Lizenzierung, setzen auf einen nicht kommerziellen freien Zugang, nicht zwingend aber die Erlaubnis zur (nicht-)kommerziellen Weiterverwendung dieser Daten. Die kommerziell verfügbaren urbanen Daten sind in der Regel aggregierte anonymisierte Datenbestände von privaten oder öffentlichen Akteuren, von deren Nutzung alle Nicht-Zahlenden ausgeschlossen werden. Interne urbane Daten sind nur einem kleinen Kreis wie etwa Polizei und Rettungsdiensten zugänglich (Fraunhofer FOKUS et al., 2018, S. 36; von Lucke, 2019, S. 357).
Es besteht ein großes Interesse an urbanen Datenräumen. Mit ihrer flexiblen IT-Infrastruktur verbessern sie den Zugang und die Verfügbarkeit von urbanen Daten und verstärken ihre Nutzung innerhalb des öffentlichen Sektors. Zudem besteht Klarheit hinsichtlich der Übertragung nicht-personenbezogener Daten. Urbane Datenräume liefern einen technisch abgesicherten Datenschutz, IT-Sicherheit und eine verbesserte Datenqualität. Zugleich fördern sie Interoperabilität und Standardisierung. Auf ihrer Grundlage lassen sich eine kommunale und regionale Datenanalyse verbessern, datenbasierte Geschäftsmodelle im urbanen Raum entwickeln und Datenmärkte aufbauen (Fraunhofer FOKUS et al., 2018, S. 14).

3.4.3 Datenräume der Europäischen Union

Die Europäische Union möchte in den 2020er-Jahren einen Binnenmarkt für Daten schaffen, in dem Daten innerhalb der EU und sektorübergreifend zum Nutzen aller fließen können. Dazu bedarf es der uneingeschränkten Anerkennung der europäischen Regeln durch die Teilnehmer, insbesondere des Schutzes der Privatsphäre und des Datenschutzes sowie des Wettbewerbsrechts. Die künftigen Regeln für den Zugang und die Nutzung von Daten sollen fair, praktisch und klar sein (Europäische Kommission, 2019).
Für den Aufbau einer Datenwirtschaft durch die EU bedarf es allerdings der Festlegung klarer und fairer Regeln für den Zugang sowie die Wiederverwendung von Daten. Dies erfordert auch Investitionen in Werkzeuge und Infrastrukturen zur Speicherung und Verarbeitung von Daten. Die Europäische Kommission sieht eine große Chance in der Vergabe von Rechten, Werkzeugen und Fertigkeiten an Benutzer, sodass diese die volle Kontrolle über ihre Daten behalten. Sie begrüßt zudem die Bündelung der Kräfte in einer europäischen Cloud und eine Zusammenführung europäischer Daten in Schlüsselsektoren mit gemeinsamen und interoperablen Datenräumen. Konkret schlägt sie den Aufbau eines Industriedatenraums, eines Datenraums für den europäischen grünen Deal, einen Mobilitätsdatenraum, einen Gesundheitsdatenraum, einen Finanzdatenraum, einen Energiedatenraum, einen Agrardatenraum und einen Kompetenzdatenraum vor. Realistisch ergänzt sie dieses Zielbild um viele gemeinsame europäische Datenräume für die öffentliche Verwaltung, sowohl auf europäischer Ebene wie auf nationaler Ebene. Vorgeschlagen werden Datenräume zur Haushaltstransparenz und zur Rechenschaftslegung, aber auch zur Korruptionsbekämpfung, zur Strafverfolgung und zur Anwendung von EU-Recht. In Datenräumen für Gov-Tech, Reg-Tech und Legal-Tech sieht sie weiteres Potenzial (Europäische Kommission, 2019). Diese Vorgaben werden in Deutschland in der 2021 präsentierten Datenstrategie der Bundesregierung aufgegriffen und weiterentwickelt. Mit der Datenstrategie sollen Dateninfrastrukturen leistungsfähig und nachhaltig ausgestaltet werden. Innovative und verantwortungsvolle Datennutzung gilt es zu steigern, Datenkompetenz zu erhöhen, eine Datenkultur zu etablieren und den Staat wieder zum Vorreiter zu machen (Bundesregierung, 2021).

3.5 Datenkataloge und Datenportale

Um die Datenbestände des öffentlichen Sektors aufzubereiten und für die Nutzung zugänglich zu machen, werden Datenkataloge und Datenportale genutzt. Der folgende Abschnitt zeigt, was sich hinter den Begriffen verbirgt und vorbildhafte Beispiele vorgestellt.
Datenkataloge
Die Einrichtung von Datenkatalogen und Datenportalen zählt zu den naheliegenden Maßnahmen, mit denen vorhandene Datenbestände erschlossen werden können. Sie bereiten den Weg vor, der die öffentliche Verwaltung zu Datenräumen führen wird.
Bei Datenkatalogen handelt es sich um Verzeichnisse von verfügbaren Datenbeständen, die sich aus Meta-Daten und Meta-Informationen zu den erfassten Datenbeständen zusammensetzen. In solchen Katalogen wird also festgehalten, welche Daten in welchen Formaten und an welchen Stellen zum Abruf bereitgestellt worden sind. Anbieter verfolgen mit diesen Katalogen das Ziel, einen schnellen Zugang zum Zugriff auf die Daten zu eröffnen. Zentrale oder dezentrale Portale bieten dazu eine benutzerfreundliche Oberfläche an, die das schnelle Auffinden der richtigen Daten und Informationen über die Datenkataloge unterstützt.
Datenportale
Datenportale sind Zugangssysteme zu Datenkatalogen und Datenbeständen. Sie erlauben einen Zugriff und eine Auswertung vorhandener Daten mit Hilfe von Abfragen, über Verzeichnisse der vorhandenen Daten oder diese nutzende Apps, durch Werkzeuge für Analysen sowie mit Hilfe von Visualisierungen und kartenbasierten Aufbereitungen. Datenportale des öffentlichen Sektors erschließen portalbasiert die Datenkataloge und Datenbestände des öffentlichen Sektors.
Auf Basis einer im Auftrag des BMI 2012 entstandenen Studie zu Open Government in Deutschland (Denker et al., 2012) wurde 2013 ein Prototyp für einen verwaltungsebenenübergreifenden Datenkatalogsverbund entwickelt. Anstelle eines zentralen Ansatzes wurde bewusst ein Verbundansatz verfolgt: Ganz im Sinne einer Datenföderation werden verschiedene Datenkataloge über einen Datenverbund und über ein Datenportal erschlossen. Im Rahmen des GovData-Verbundes erfolgt eine regelmäßige Ergänzung und Aktualisierung der Metadaten von kommunalen, Landes- und Fachportalen in Richtung des GovData-Portals und von dort weiter in Richtung des Europäischen Datenportals. Durch diesen kaskadischen Ansatz wird sichergestellt, dass Inhalte von kommunalen Datenkatalogen in Landesdatenkataloge integriert werden können und dass Inhalte der Datenkataloge des Bundes und der Landesdatenkataloge in den gemeinsamen Datenkatalog fließen können. Das Datenportal GovData (2021) erschließt heute diesen in den Regelbetrieb überführten Datenkatalogsverbund. Es wird als das Datenportal für Deutschland positioniert. Den Betrieb verantwortete die Geschäfts- und Koordinierungsstelle Open Data im Auftrag des IT-Planungsrats, deren Sitz in Hamburg ist. Zum 01.01.2023 übernimmt diese Aufgabe die neu gegründete Anstalt FITKO.
Der ebenenübergreifende Ansatz ist in seiner Konzeption weltweit ein vorbildhafter Meilenstein gewesen. Die große Herausforderung liegt jedoch darin, Bund, Länder und Kommunen dazu zu bewegen, eigene Datenkataloge aufzubauen und zu pflegen, solange eine rechtliche Grundlage dazu noch nicht gegeben ist.
Mit dem Geoportal.de des Bundesamtes für Kartografie und Geodäsie werden darüber hinaus die offenen Geodaten in Deutschland erschlossen, die ohne Zugangsbeschränkungen frei nutzbar sind und den Nutzungsbedingungen einer offenen Lizenz unterliegen.
Auf europäischer Ebene gibt es zwei Ansätze, die sich gegenseitig ergänzen und nun fusionieren. Das offene Datenportal der Europäischen Union (2021) bietet einen Zugang zu den offenen von den Organen, Einrichtungen und sonstigen Stellen der EU veröffentlichten Daten. Das Europäische Datenportal/Das offizielle Portal für Daten zu Europa (2021) erschließt dagegen die mehr als 80 Datenkataloge von 36 europäischen Länder und der europäischen Institutionen.
Bemerkenswert ist auch der österreichische Ansatz, ergänzend zum öffentlichen Datenportal Open Data Österreich (2021) mit dem Open Data Portal Österreich (2021) ein weiteres offenes Datenportal für Wirtschaft, Kultur, NGO/NPO, Forschung und Zivilgesellschaft aufzubauen, um auch deren offenen Datenbestände zeitnah erschließen und nutzen zu können. Ein solches Portal trägt dazu bei, ein Bewusstsein für das Potenzial offener Daten auch über Staat und Verwaltung hinaus zu wecken und weitere Datenschätze zu gewinnen.

3.6 Große Potenziale durch Datenwissenschaften

Die Relevanz von Daten wird auch in Zukunft weiter zunehmen. Um diese Entwicklungen mitgestalten zu können, ist die Ausbildung im Bereich der Datenwissenschaften auch für den öffentlichen Sektor von großer Relevanz.
Datenwissenschaften
Offene Daten und offene Verwaltungsdaten benötigen ein interdisziplinäres wissenschaftliches Fundament. Beiträge der Verwaltungs-, Wirtschafts-, Medieninformatik und Informatik, des öffentlichen Rechts, der Verwaltungswissenschaft und der Politikwissenschaft in Kombination mit empirischen Sozialwissenschaften, Statistik und insbesondere den Datenwissenschaften unterstreichen ganz unterschiedliche Sichtweisen auf offene Daten, vielfältige Herangehensweisen und eine gelebte Methodenvielfalt (von Lucke, 2019, S. 351).
Die Datenwissenschaften selbst sind ein neues wissenschaftliches Gebiet, bei dem die Anwendung neuer statistischer Verfahren zur Arbeit mit Daten und Informationen im Mittelpunkt steht. Vor allem mit Hilfe von Hardware- und Softwarewerkzeugen werden entscheidungsrelevante Informationen aus Daten abgeleitet. Zur Datenanalyse wird zunehmend auf maschinelle Lernverfahren (künstliche Intelligenz) statt auf Menschen gesetzt, weil sie auch bei großen heterogenen Datenmengen schnell zu besseren Ergebnissen kommen (Bundesregierung, 2021, S. 86).
Datenwissenschaftliche Werkzeuge
Datenwissenschaftler benötigen Datenkompetenz für den fachkundigen Umgang mit Daten. Dazu bedarf es Informationskompetenz, Statistikkompetenz und technische Fähigkeiten. Insofern gilt es Fähigkeiten zu erwerben, um Informationen kritisch zu hinterfragen und daraus Schlüsse ziehen zu können, um sich mit statistischen Analysen kritisch auseinanderzusetzen und mit statistischen Methoden und Anwendungsfällen umzugehen sowie um digitale Dienste und Werkzeuge verstehen, nutzen und programmieren zu können. Zu den datenwissenschaftlichen Werkzeugen, mit denen sich Datenwissenschaftler im Rahmen ihrer Ausbildung vertraut machen müssen, zählen die Statistik und statistische Methoden, Methoden der Mustererkennung, Data Warehousing, Data Mining und Datenvisualisierung, Simulationen, Big Data Analysen sowie maschinelles Lernen und künstliche neuronale Netzwerke. Dadurch eröffnen sich innovative Ansätze, wie mit Hilfe von Analysen und Visualisierungen neue Erkenntnisse und substanzielle Effizienzvorteile in Forschung, Entwicklung und Erschließung neuer Märkte realisiert werden können, die über klassische Innovationsstrategien nicht zu erreichen sind (von Lucke, 2019, S. 355).
Erkenntnisse aus den Datenwissenschaften
Gelingt es in enger Zusammenarbeit mit Partnern, Entwicklern und Nutzern offene Daten nutzbringend zu verwerten und zu veredeln, lassen sich effizientere Prozesse und bessere Ergebnisse, aber auch neue Arbeitsplätze, zusätzliche Steuereinnahmen und Forschungsaufträge generieren (von Lucke, 2019, S. 355). Einen ersten Blick in eine datenbasierte Zukunft eröffnet bereits Virtual Singapore, ein dreidimensionales Stadtmodell Singapurs mit kollaborativer Datenplattform. Es wurde mit finanzieller Unterstützung durch die nationale Forschungsstiftung aufgebaut. Dieser digitale Zwilling wird Planungsprozesse im Stadtstaat verändern und grundlegend beschleunigen. So erlaubt er eine digitale Stadtplanung, bei der sich für jedes intendierte Siedlungs- und Gebäudemodell in Sekunden die verschiedenen gesetzlichen Anforderungen über simple Parametereinstellungen berücksichtigen und dies in planungskonforme Gebäudeinformationsmodelle (BIM) überführen lassen.
Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 International Lizenz (http://​creativecommons.​org/​licenses/​by/​4.​0/​deed.​de) veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.
Literatur
Zurück zum Zitat BMBF. Bundesministerium für Bildung und Forschung (2020). Industrie 4.0. BMBF. Bundesministerium für Bildung und Forschung (2020). Industrie 4.0.
Zurück zum Zitat Bundesregierung. (2021). Datenstrategie der Bundesregierung – Eine Innovationsstrategie für gesellschaftlichen Fortschritt und nachhaltiges Wachstum. Bundesregierung. (2021). Datenstrategie der Bundesregierung – Eine Innovationsstrategie für gesellschaftlichen Fortschritt und nachhaltiges Wachstum.
Zurück zum Zitat IG Collaboratory. (2010). Internet & Gesellschaft Collaboratory: Offene Staatskunst – Bessere Politik durch Open Government?, Abschlussbericht (1. Aufl.). IG Collaboratory. (2010). Internet & Gesellschaft Collaboratory: Offene Staatskunst – Bessere Politik durch Open Government?, Abschlussbericht (1. Aufl.).
Zurück zum Zitat von Lucke, J. (2010). Open Government – Öffnung von Staat und Verwaltung – Gutachten für die Deutsche Telekom AG zur T-City Friedrichshafen. In J. von Lucke (Hrsg.), Entdeckung, Erkundung und Entwicklung 2.0: Open Government, Open Government Data und Open Budget 2.0, Schriftenreihe des Deutsche Telekom Institute for Connected Cities | TICC der Zeppelin Universität Friedrichshafen (Bd. 1, S. 53–103). epubli GmbH. von Lucke, J. (2010). Open Government – Öffnung von Staat und Verwaltung – Gutachten für die Deutsche Telekom AG zur T-City Friedrichshafen. In J. von Lucke (Hrsg.), Entdeckung, Erkundung und Entwicklung 2.0: Open Government, Open Government Data und Open Budget 2.0, Schriftenreihe des Deutsche Telekom Institute for Connected Cities | TICC der Zeppelin Universität Friedrichshafen (Bd. 1, S. 53–103). epubli GmbH.
Zurück zum Zitat von Lucke, J. (2019). Spannende Gestaltungsperspektiven durch offene Verwaltungsdaten. In C. Ochs, M. Friedewald, T. Hess & J. Lamla (Hrsg.), Die Zukunft der Datenökonomie – Medienkulturen im digitalen Zeitalter (S. 343–365). Springer VS. von Lucke, J. (2019). Spannende Gestaltungsperspektiven durch offene Verwaltungsdaten. In C. Ochs, M. Friedewald, T. Hess & J. Lamla (Hrsg.), Die Zukunft der Datenökonomie – Medienkulturen im digitalen Zeitalter (S. 343–365). Springer VS.
Zurück zum Zitat von Lucke, J., & Geiger, C. (2010). Open Government Data – Frei verfügbare Daten des öffentlichen Sektors. Deutsche Telekom Institute for Connected Cities. von Lucke, J., & Geiger, C. (2010). Open Government Data – Frei verfügbare Daten des öffentlichen Sektors. Deutsche Telekom Institute for Connected Cities.
Zurück zum Zitat von Lucke, J., Becker, F., & Lübbert, L. (2021). Datenethikkonzept der Stadt Ulm. In E. Schweighofer, S. Eder, P. Hanke, F. Kummer & A. Saarenpää (Hrsg.), Cybergovernance – Tagungsband des 24. IRIS 2021 (S. 383–392). Editions Weblaw. von Lucke, J., Becker, F., & Lübbert, L. (2021). Datenethikkonzept der Stadt Ulm. In E. Schweighofer, S. Eder, P. Hanke, F. Kummer & A. Saarenpää (Hrsg.), Cybergovernance – Tagungsband des 24. IRIS 2021 (S. 383–392). Editions Weblaw.
Zurück zum Zitat North, K. (2002). Wissensorientierte Unternehmensführung. Wertschöpfung durch Wissen. 3., aktualisierte und erweiterte Auflage. Springer Gabler. North, K. (2002). Wissensorientierte Unternehmensführung. Wertschöpfung durch Wissen. 3., aktualisierte und erweiterte Auflage. Springer Gabler.
Zurück zum Zitat Sunlight Foundation. (2010). Ten principles for opening up government information. Sunlight Foundation. Sunlight Foundation. (2010). Ten principles for opening up government information. Sunlight Foundation.
Metadaten
Titel
Offene Daten und offene Verwaltungsdaten – Öffnung von Datenbeständen
verfasst von
Jörn von Lucke
Katja Gollasch
Copyright-Jahr
2022
DOI
https://doi.org/10.1007/978-3-658-36795-4_3