Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
 

25.08.2009

Potsdam. Spam, als unerwünschte Werbung bislang vor allem ein Problem bei der Nutzung von E-Mails, dringt immer mehr auch in die Netzwerke des Mitmach-Web 2.0 vor: Wer sich bei Facebook, Twitter und anderen Internet-Diensten auf die Suche nach Experten-Informationen und Trends macht, stößt immer häufiger auf werbliche Inhalte, die Profi-Spammer dort platzieren. Zwei Wissenschaftler des Hasso-Plattner-Instituts (HPI) haben jetzt gemeinsam mit drei britischen Kollegen eine Software entwickelt, die Abhilfe schafft: Sie ermittelt einerseits die Expertise aktiver Internet-Nutzer sowie die Qualität von Webseiten und lässt andererseits – quasi nebenbei – aufgespürte Spammer von der Oberfläche verschwinden.

„Studien zur Spammer-Dichte in Expertennetzwerken oder Interessens-gemeinschaften des Internets nennen Werte zwischen 10 und 80 Prozent“, berichtet HPI-Doktorand Michael Noll. Eine kürzlich veröffentliche Untersuchung zur Social Bookmarking-Website Delicious.com ermittelte beispielsweise, dass 19 der 20 zu jener Zeit aktivsten Benutzer Spammer waren. „Die Menge der Benutzeraktionen ist in der Praxis oftmals immer noch das wichtigste Kriterium, um die Expertise von Benutzern zu beurteilen – aber Quantität bedeutet nicht zwangsweise Qualität“, so der Informatiker.

Deshalb gingen Noll und sein Professor Christoph Meinel zusammen mit ihren britischen Kollegen einen anderen Weg bei der Entwicklung der SPEAR genannten Software (Spamming-resistant Expertise Analysis and Ranking): Die Expertise eines Internetnutzers liest das Programm daran ab, wie hoch die Qualität der von ihm gefundenen und mit Schlagworten erschlossenen Webseiten ist. Und die Qualität der Webseiten wird wiederum daran gemessen, wie viele Experten diese als interessant und hochwertig bezeichnen.

„Mit dieser Wechselwirkung bevorzugen wir somit eindeutig die Qualität vor der Quantität“, ergänzt Meinel, der das HPI und dessen Fachgebiet Internet-Technologien und -Systeme leitet. Das zweite wichtige Kriterium dieses neuen Ansatzes ist die Aktualität: Wer eine qualitativ hochwertige Information im Web früher als andere Internetnutzer entdeckt und auf sie verweist, dem gibt das Programm einen Bonus. „Wir suchten in einem Test mit unserem neuen SPEAR-Algorithmus die Delicious-Seiten nach Experten für eine Programmiersprache ab und fanden dabei unter den ersten 200 Listenplätzen nicht einen einzigen Spammer. Andererseits stufte SPEAR zwei professionelle Software-Entwickler als die beiden besten Experten für dieses Gebiet ein“, berichtet Noll.

Bessere Qualität von Empfehlungen, etwa bei Amazon und Last.fm
Der Ansatz der beiden deutschen Informatiker und ihrer britischen Kollegen Ching-man Au Yeung, Dr. Nicholas Gibbins und Prof. Nigel Shadbolt (Universität Southampton) kann zum Beispiel helfen, die individuellen Kaufempfehlungen des Online-Händlers Amazon passgenauer zu machen - durch Zusatzinformationen zum Kaufverhalten oder zu Produktrezensionen von Kunden. Oder Nutzer eines Musikdienstes wie Last.fm können verbesserte Empfehlungen bekommen, die sich stärker an ihren Hörgewohnheiten orientieren. Gewissermaßen als Nebenprodukt filtert der SPEAR-Algorithmus Spammer heraus. Profis wird es dadurch sehr schwer gemacht, unerwünschte Werbung noch an prominenter Stelle auftauchen zu lassen.

Der Einsatzbereich von SPEAR ist jedoch nicht auf Online-Dienste beschränkt. Künftig könnte die neu entwickelte Analyse-Software auch dabei helfen, die Expertise von Forschern anhand ihrer wissenschaftlichen Veröffentlichungen zu untersuchen. „Ob gedruckt oder online – solche Publikationen enthalten alle notwendigen Informationen, um den SPEAR-Algorithmus erfolgreich anzuwenden“, betont Meinel. SPEAR ist eine für den speziellen Verwendungszweck angepasste Weiterentwicklung des in Fachkreisen bekannten Algorithmus HITS (Hyperlink-Induced Topic Search) zum Ranking von Webseiten. Prof. Jon Kleinberg (Cornell University) hatte ihn 1999 entwickelt.

Weitere Informationen

Diese Pressemitteilung als Download (.pdf)