Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
 

Semantic Media Mining (Wintersemester 2012/2013)

Dozent: Dr. rer. nat. Harald Sack (Internet-Technologien und -Systeme) , Christian Hentschel (Internet-Technologien und -Systeme)

Allgemeine Information

  • Semesterwochenstunden: 4
  • ECTS: 6
  • Benotet: Ja
  • Einschreibefrist: 1.10.2012 - 31.10.2012
  • Lehrform: Seminar
  • Belegungsart: Wahlpflichtmodul

Studiengänge, Modulgruppen & Module

IT-Systems Engineering BA

Beschreibung

In jüngster Zeit wachsen die Forschungsgebiete Semantic Web, Web 2.0, Social Network Analysis und Machine Learning immer weiter zusammen. Auf diesem Fundament entstehen neue Data Mining Anwendungen, die zuvor ungeahnte Rückschlüsse auf statistische Zusammenhänge, Marktentwicklungen oder auch die öffentlichen Meinung ermöglichen. Dabei ergänzen Semantic Web Technologien in Verbindung mit linguistischen und statistischen Analyseverfarten die traditionellen Data Mining Ansätze und ermöglichen es, die in der ungeheueren Datenflut des Webs versteckten Informationen zu filtern und korrekt zu interpretieren. Untersuchungsgegenstand sind dabei Textinhalte jeglicher Art, seien es Dokumente in natürlicher Sprache, Microposts oder strukturierte Daten, die über APIs oder via Crawling-Technologien gewonnen werden. Darauf aufbauend können intelligente Empfehlungen (Recommendations) ermittelt werden, die den bislang existierenden Logfile-basierten Ansätzen (Collaborative Filterung) überlegen sind.

Im Seminar Semantic Media Mining soll auf Basis der oben genannten Technologien in studentischen Teams (je 2-3 Studenten) eine der folgenden Anwendungen entwickelt werden:

- Erfassung und korrekte Interpretation von statistischen Fußballdaten aus Webseiten, Blogbeiträgen, News-Artikeln und Microposts und deren semantische Weiterverarbeitung

- Ableiten von intelligenten Produktempfehlungen (Werbung) auf der Basis von beliebigen Textinhalten (News-Artikel, microposts, andere Metadaten)

Lern- und Lehrformen

  • Projektseminar (selbständige und angeleitete Gruppenarbeit, Vorträge)
  • Gruppen à 2 bis 3 Studenten

Leistungserfassung

Die Noten setzen sich aus den folgenden Faktoren zusammen:

  • Zwischen- und Endpräsentation
  • Seminararbeit
  • Mitarbeit im Seminar

Zurück