Potsdam. Bachelorstudenten des Hasso-Plattner-Instituts (HPI) haben Werkzeuge entwickelt, die es ermöglichen, Fakten in der frei bearbeitbaren Wissensdatenbank Wikidata zu überprüfen. Das soll die Vollständigkeit und Korrektheit der Daten des rasant wachsenden Datenbestands sicherstellen. Ihre Lösung stellten die sechs HPI-Studenten am 6. Juli im „Bachelorpodium“ vor, zu dem gut 200 Gäste aus Politik, Wirtschaft, Wissenschaft und Gesellschaft nach Potsdam gekommen waren.
Das Ergebnis hatten die Informatiker zusammen mit dem Projektpartner Wikimedia Deutschland entwickelt, der Gesellschaft zur Förderung Freien Wissens e.V. Deren Datenbank Wikidata enthält mittlerweile über 14 Mio. von Internetnutzern erstellte und gepflegte Artikel zu vielen Themen. Ein Ziel von Wikidata ist es, Schwesterprojekte wie Wikipedia mit diesen Daten zu unterstützen.
Zwei verschiedene Ansätze tragen zur Überprüfung der Daten bei: Zum Einen sind in Wikidata momentan 5.000 Regeln definiert, welche die Widerspruchsfreiheit von Daten sichern. Eine davon besagt, dass Ehepartner sich gegenseitig als solche angeben müssen. Eine andere Regel stellt sicher, dass bei Nennung des Sterbedatums einer Person auch deren Geburtstag angegeben sein muss. „Hier spürt unsere Software Verletzungen solcher Regeln auf, weist auf fehlende oder fehlerhafte Daten hin und hilft, sie zu korrigieren“, erläuterte Andreas Burmeister, Sprecher der Bachelorprojektgruppe.
Darüber hinaus zieht die Lösung der HPI-Studenten unter anderem auch Daten der Deutschen Nationalbibliothek zum Vergleich hinzu. „Diese Daten enthalten unter anderem Informationen zu 2,3 Millionen Personen der Zeitgeschichte, mit denen zum Beispiel Geburtsdaten und familiäre Beziehungen überprüft werden können“, sagte Burmeister.
Mit dem Ergebnis zeigte sich Lydia Pintscher, Produktmanagerin von Wikidata, sehr zufrieden: „Das Projekt der Studentengruppe ist ein wichtiger Baustein, um die Qualität der Daten in Wikidata zu sichern und gleichzeitig seine Offenheit zu bewahren“.
Die Projektgruppe wurde von HPI-Professor Dr. Felix Naumann, Leiter des Fachgebiets Informationssysteme, und Doktorandin Anja Jentzsch betreut.