Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
 

www.ligageschichte.de (Sommersemester 2008)

Dozent: Dr. Alexander Albrecht (Information Systems) , Prof. Dr. Felix Naumann (Information Systems)

Allgemeine Information

  • Semesterwochenstunden: 2
  • ECTS: 6
  • Benotet: Ja
  • Einschreibefrist: 28.04.2008
  • Lehrform:
  • Belegungsart: Wahlpflichtmodul

Studiengänge

  • IT-Systems Engineering BA

Beschreibung

Im Rahmen dieses Projektseminars wird das Fussball-Portal www.ligageschichte.de an den Start gebracht. In diesem Portal werden Ergebnisse, Statistiken und Tabellenverläufe für jeden Club und alle Bundesliga-Saisons präsentiert. Eine Herausforderung ist dabei das automatische Annotieren der präsentierten Fakten mit Sprechblasen über wichtige Ereignisse und Trends. So sind beispielsweise Informationen über mögliches Verletzungspech, einen drohenden Trainerwechsel oder die jeweilige Mannschaftsleistung interessant.


Die notwendigen Fussballdaten sollen von den Teilnehmern im ersten Schritt aus einer Vielzahl unterschiedlicher Web-Quellen (Vereinsseiten, Newsquellen, Bundesliga-Archive, ...) extrahiert werden. Neben der Datenextraktion und Informationsvisualisierung wird im Seminar vorwiegend das Thema Data Mining mit den Schwerpunkten Named Entity Recognition und Topic/Trend Detection behandelt.  Diese Techniken erlauben das automatisierte Entdecken von Ereignissen und Trends, z.B. in Newstexten oder Spielberichten.


Die Teilnehmerzahl ist auf 12 Mitglieder beschränkt. Die technische Umsetzung erfolgt mit Java. Als Voraussetzung sind Java oder eine Skriptsprache (Perl, Python, Ruby, PHP) sehr vorteilhaft. Zudem sind Datenbankkenntnisse notwendig.

Lehrinhalte

  • Named Entity Recognition
  • Mustererkennung / Reguläre Ausdrücke
  • Topic/Trend Detection
  • Datenreinigung
  • Statistische Analyse
  • Informationsvisualisierung

Lern- und Lehrformen

  • Projektseminar

Leistungserfassung

Die Bewertung der Seminarleistung zur Erreichung von 6 Credit Points erfolgt aufgrund der erbrachten Leistungen in den Bereichen Datenextraktion, Data-Mining und Informationsvisualisierung, sowie des Vortrags, der Präsentation der Ergebnisse und der schriftlichen Ausarbeitung.

Termine

  • Mittwochs 9:15 in A-1.1
  • Die Einführungsveranstaltung findet am 16. April 2008 um 9:15 Uhr in Raum A-1.1 statt.

Zurück