Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
  • de
 

Dissertation Michael Noll

Understanding and Leveraging the Social Web for Information Retrieval

Seit seinen Ursprüngen in den 1990er Jahren ist das World Wide Web stetig und stark gewachsen. Heute ermöglicht es Millionen von Menschen den Zugriff auf eine gewaltige Menge an Daten und Informationen. In den letzten Jahren wird das Web zunehmend auch für soziale Interaktionen und Kollaborationen von Nutzern verwendet. Für diese Entwicklung wurde der Begriff Web 2.0 bzw. Soziales Web geprägt. Das Soziale Web basiert auf einer technischen Architektur und einer Kultur der Partizipation, welche die Barrieren für Online-Kollaborationen über das Web beseitigen und die Nutzer dazu animieren, Web-Inhalte zu erstellen, wiederzuverwenden und auszutauschen. Eines der prominentesten Merkmale des Sozialen Webs ist das Konzept des kollaborativen Taggen. Unter Taggen versteht man das manuelle Annotieren von Web-Ressourcen (z.B. Webseiten, Bilder und Videos) mit Schlagworten, welche Tags genannt werden. Im Wesentlichen können Nutzer durch Taggen ausdrücken, wie ihrer Meinung nach das Web organisiert werden sollte. Aus diesem kollaborativen Taggen entsteht mit der Zeit eine neue Form von Klassifizierungsschema, für das sich der Begriff Folksonomie durchgesetzt hat. Folksonomien stellen eine Art basisdemokratischen Ansatz zum Verschlagworten und Organisieren von Web-Inhalten dar und sind in diesem  Sinne strukturell verschieden von formellen, hierarchischen Ansätzen wie etwa Ontologien oder Taxonomien.

In der vorliegenden Dissertation konzentrieren wir uns auf die Analyse von Folksonomien und kollaborativem Taggen im Forschungsbereich des Web Information Retrieval. Wir beschreiben empirische Studien über Folksonomien und demonstrieren, wie deren Ergebnisse dazu verwendet werden können, verschiedene Techniken des Forschungsbereichs zu erweitern und zu verbessern.
Im ersten Teil der Dissertation präsentieren wir eine umfassende  Literaturübersicht aktueller Forschung über Folksonomien und kollaborativem Taggen. Im Anschluss beschreiben wir unsere explorativen Studien über
die in Folksonomien versteckten Informationen mit Blick auf das Web  Information Retrieval. Unsere Forschungsergebnisse zeigen, dass Folksonomien neue, komplimentäre Informationen über Web-Ressourcen enthalten, welche nicht in deren Inhalten oder anderweitigen Metadaten enthalten sind, wie z.B. in Angaben der Autoren jener Ressourcen.
Im zweiten Teil der Dissertation präsentieren wir anhand dreier Anwendungsfälle, wie das Wissen und die experimentellen Ergebnisse des ersten Teils dazu ausgenutzt werden können, Fortschritte im Bereich des Web Information Retrieval zu erzielen. Zunächst untersuchen wir die Expertise oder „Vertrauenswürdigkeit“ von Nutzern in Folksonomien und stellen einen Algorithmus namens SPEAR vor, welcher Nutzer ihrer Expertise nach einordnen kann. Wir evaluieren diesen Algorithmus und weisen nach, dass dieser auch widerstandsfähig gegenüber Spam-Aktivitäten ist. Im zweiten Schritt präsentieren wir einen Ansatz zur personalisierten Suche im Web, welcher Profile von Nutzern und Web-Ressourcen anhand von Folksonomien erstellt, und zeigen auf, wie dieser Ansatz in der Praxis umgesetzt werden kann. Abschliessend untersuchen wir, wie die Konzepte des kollaborativen Taggen und der Folksonomien für das Filtern von Web-Inhalten verwendet werden können. Wir präsentieren eine Fallstudie einer prototypischen Implementierung namens TaggyBear und beschreiben und evaluieren deren Systemdesign und -anatomie.