Hasso-Plattner-Institut
Prof. Dr. Felix Naumann
 

Wikidata.lib

Wikidata ist der Name einer frei bearbeitbaren Datenbank, die unter anderem das Ziel hat, Wikipedia zu unterstützen. Das Projekt wurde von Wikimedia Deutschland gestartet und soll als gemeinsame Quelle bestimmte Datentypen für Wikimedia-Projekte bereitstellen, zum Beispiel Geburtsdaten oder sonstige allgemeingültige Daten, die in allen Artikeln der Wikimedia-Projekte verwendet werden können. Am 15. Dezember 2012 wurde das ein-millionste Datenelement eingetragen, am 3. März 2013 das Sechsmillionste, am 26. April wurde die 12-Millionen-Marke erreicht.

Die Entwicklung von Wikidata begann im April 2012 und wurde durch Spenden des Allen Institute for Artificial Intelligence, der Gordon and Betty Moore Foundation und der Google Inc. finanziert. Im Juni 2013 wurde eine Spende von Yandex zur weiteren Finanzierung bekanntgegeben.

Wikidata hat großes Potenzial, auch außerhalb der Wikipedien Verwendung zu finden. Um dieses Potenzial auszuschöpfen werden Methoden und Werkzeuge benötigt, die externe Anwendungen in der Verwendung der strukturierten Daten aus Wikidata unterstützen.

Projektpartner

Wikidata.lib ist ein gemeinsam mit der Organisation Wikimedia Deutschland (Berlin) durchgeführtes Projekt. Die Wikimedia Deutschland – Gesellschaft zur Förderung Freien Wissens e. V. (WMDE) ist die deutsche Sektion der Wikimedia Foundation, die verschiedene Wikipedien und andere Projekte betreibt.

Wikimedia Deutschland wurde als erste nationale Wikimedia-Organisation von der Wikimedia Foundation anerkannt. Satzungsgemäßer Zweck des Vereins ist es, „die Erstellung, Sammlung und Verbreitung freier Inhalte (engl. Open Content) in selbstloser Tätigkeit zu fördern, um die Chancengleichheit beim Zugang zu Wissen und die Bildung zu fördern.“

Der Verein beschäftigt 35 Angestellte, 10 Werkstudenten sowie 9 Mitarbeiter im Projekt Wikidata. Die Zusammenarbeit im Rahmen des Bachelorprojekts erfolgt mit Berliner Kollegen des Wikidata-Projektes.

Projektbeschreibung

Die Aufgabe des Projektteams ist es, in Kooperation mit dem Projektpartner Wikimedia Deutschland, ein Open Source-Ökosystem Wikidata.lib aufzubauen, welches die Entwicklung externer Applikationen unterstützt, und dadurch die strukturierten Daten aus Wikidata für verschiedene Aufgaben nützlich macht. Zu den möglichen Komponenten dieses Ökosystems gehören:

  • Erweiterung der Wikidata-Infrastruktur um eine PubSubHubbub-Komponente, welche externen Seiten und Anwendungen die Arbeit mit stets aktuellen Wikidata-Daten ermöglicht
  • Methoden und Werkzeuge zum Spiegeln von Wikidata, für die einfachere Analyse und mächtigere Anfragebeantwortung, z.B. als eine Amazon VM Instanz mit der Möglichkeit, SPARQL-Anfragen darauf ausführen zu lassen
  • Bibliotheken in mehreren Programmiersprachen zur einfachen Verwendung von Wikidata-Daten in eigenen Applikationen
  • Anwendungen zum Matchen externer Datenbankinhalte mit Wikidata-Inhalten, z.B. zum automatischen Bestimmen passender Wikidata-Item IDs für die Inhalte in einer Datenbank mit Städten, Personen, Produkten, etc.
  • Beispielanwendungen oder Erweiterungen bestehender Anwendungen, die mit Wikidata-Daten angereichert werden, z.B. intelligentere Formulare, Medienbibliotheken, Personal-Information-Management Tools, etc.
  •  Anwendungen zum provisorischen Hochladen von Daten nach Wikidata, welche angeboten werden, aber erst durch die Community bestätigt werden müssen
  • Methoden zum Plausibilitätscheck für importierte Daten

Betreuung

Das Projekt wird durch Prof. Dr. Felix Naumann und Anja Jentzsch betreut.