Skip to main content
main-content

26.09.2014 | Programmiersprachen | Im Fokus | Onlineartikel

Das Web der Daten boomt und pusht die Forschung

Autor:
Andreas Burkert
2:30 Min. Lesedauer

Wem nutzen all die Informationen im Internet, wenn sie nicht sinnvoll verknüpft werden? Linked Open Data heißt die Lösung und findet derzeit enorme Beachtung, wie nun Forscher des Hasso-Plattner-Instituts herausgefunden haben. Das „Web der Daten“ hat sich seit Herbst 2011 mehr als verdreifacht - zur Freude der Forschung.

Verloren im Datensumpf des Internets. Internetnutzer sehen sich derzeit einer kaum zu überschaubaren Flut an Informationen, Bildern und Applikationen gegenüber, wissen die Springer-Autoren Gianfranco Walsh, Berthold H. Hass und Thomas Kilian. „Vor diesem Hintergrund erwächst auf Seiten von Nutzern aber auch kommerziellen Anbietern der Wunsch, Internetinhalte besser handhabbar zu machen“, schreiben sie in Kapitel „Linked Open Data für die Exploration von Wissen im Web 2.0 mit SemaPlorer“. Eine strukturierte Analyse ist sonst kaum mehr möglich.

Immerhin hat sich das „Web der Daten“ seit Herbst 2011 mehr als verdreifacht, so das Ergebnis einer Analyse, die soeben Wissenschaftler der Universität Mannheim, des Hasso-Plattner-Instituts (HPI) sowie des irischen Insight Centre veröffentlicht haben. Die Informatiker publizierten auf der Internetseite http://lod-cloud.net ein aktuelles Diagramm, das von den 1.019 offen zugänglichen Sätzen strukturierter Daten 570 besonders eng verknüpfte anzeigt. 2011 waren es noch 295 Sätze solcher Linked Open Data gewesen und vier Jahre vorher 12.

Verknüpfte Daten können Experimente ersetzen

Waren 2011 im Daten-Web immerhin schon fast 32 Milliarden standardisierte Beschreibungen von Personen, Dingen und Ereignissen zu finden, stießen die Forscher kürzlich auf gut 84 Milliarden solcher so genannten Tripel. Nach wie vor im Mittelpunkt der Linked Open Data-Übersicht steht DBpedia, gewissermaßen die Datenversion von Wikipedia, einer Online-Enzyklopädie aus freien Inhalten, zu der jeder mit seinem Wissen beitragen kann. Eine wichtige Rolle spielen aber auch Daten zur Geographie, zu den Biowissenschaften, aus Behörden sowie aus den Bereichen Medien und Bildung.

„Das enorme Wachstum des Webs der Daten beweist, wie wichtig es ist, Welt-Wissen nicht nur Menschen, sondern auch Computern zugänglich zu machen“, sagte Prof. Christian Bizer, Wirtschaftsinformatiker von der Universität Mannheim. Prof. Felix Naumann, am Hasso-Plattner-Institut Leiter des Fachgebiets Informationssysteme, verwies darauf, dass beispielsweise in den Biowissenschaften zunehmend die Verknüpfung vorhandener Experimentaldaten sonst notwendige Laborversuche ersetzten. „Und wenn ähnlich wie in angelsächsischen Ländern auch deutsche Behörden vermehrt Daten veröffentlichen würden, wäre ein höheres Maß an Bürgerbeteiligung zu erwarten“, ergänzte der Potsdamer Informatikwissenschaftler.

Weitere Artikel zum Thema

Um die Übersicht von 2011 zu aktualisieren, durchsuchten die Wissenschaftler jetzt das Datenweb systematisch und kombinierten das Ergebnis mit Informationen aus dem Datenkatalog http://datahub.io. Das Diagramm in Form eines Netzwerks aus farbigen Kreisen illustriert die Vielfalt der Themenbereiche. Jeder der Kreise stellt einen Satz veröffentlichter und verknüpfter Daten dar. Verbindungslinien zeigen in unterschiedlicher Stärke den Grad der Vernetzung.

Weiterführende Themen

Die Hintergründe zu diesem Inhalt

Premium Partner

    Bildnachweise