Hasso-Plattner-Institut
Prof. Dr. Felix Naumann
 

26.09.2014

Internet-Wachstum: Datenweb seit 2011 mehr als verdreifacht

Das „Web der Daten“ hat sich seit Herbst 2011 mehr als verdreifacht. Das ist das Ergebnis einer Analyse, die Wissenschaftler der Universität Mannheim, des Hasso-Plattner-Instituts (HPI) sowie des irischen Insight Centre veröffentlicht haben. 

Wachstum des Datenwebs

Die Informatiker publizierten auf der Internetseite http://lod-cloud.net ein aktuelles Diagramm, das von den 1.019 offen zugänglichen Sätzen strukturierter Daten 570 besonders eng verknüpfte anzeigt. 2011 waren es noch 295 Sätze solcher Linked Open Data gewesen und vier Jahre vorher 12. Diese von Web-Pionier Tim Berners-Lee 2007 angestoßene Form der Verbreitung erlaubt es Computern, Informationen so zu durchsuchen und anzureichern, wie Menschen es seit jeher über Seiten im World Wide Web tun.

Um die Übersicht von 2011 zu aktualisieren, durchsuchten die Wissenschaftler jetzt das Datenweb systematisch und kombinierten das Ergebnis mit Informationen aus dem Datenkatalog http://datahub.io. Das Diagramm in Form eines Netzwerks aus farbigen Kreisen illustriert die Vielfalt der Themenbereiche. Jeder der Kreise stellt einen Satz veröffentlichter und verknüpfter Daten dar. Verbindungslinien zeigen in unterschiedlicher Stärke den Grad der Vernetzung.

Waren 2011 im Daten-Web immerhin schon fast 32 Milliarden standardisierte Beschreibungen von Personen, Dingen und Ereignissen zu finden, stießen die Forscher kürzlich auf gut 84 Milliarden solcher so genannten Tripel. Nach wie vor im Mittelpunkt der Linked Open Data-Übersicht steht DBpedia, gewissermaßen die Datenversion von Wikipedia, einer Online-Enzyklopädie aus freien Inhalten, zu der jeder mit seinem Wissen beitragen kann. Eine wichtige Rolle spielen aber auch Daten zur Geographie, zu den Biowissenschaften, aus Behörden sowie aus den Bereichen Medien und Bildung.

„Das enorme Wachstum des Webs der Daten beweist, wie wichtig es ist, Welt-Wissen nicht nur Menschen, sondern auch Computern zugänglich zu machen“, sagte Prof. Christian Bizer, Wirtschaftsinformatiker von der Universität Mannheim. Prof. Felix Naumann, am Hasso-Plattner-Institut Leiter des Fachgebiets Informationssysteme, verwies darauf, dass beispielsweise in den Biowissenschaften zunehmend die Verknüpfung vorhandener Experimentaldaten sonst notwendige Laborversuche ersetzten. „Und wenn ähnlich wie in angelsächsischen Ländern auch deutsche Behörden vermehrt Daten veröffentlichen würden, wäre ein höheres Maß an Bürgerbeteiligung zu erwarten“, ergänzte der Potsdamer Informatikwissenschaftler.