Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
Login
 

www.ProminentPeople.info (Wintersemester 2007/2008)

Dozent: Prof. Dr. Felix Naumann (Information Systems)
Tutoren: Dr. Alexander Albrecht

Allgemeine Information

  • Semesterwochenstunden: 2
  • ECTS: 3
  • Benotet: Ja
  • Einschreibefrist: 22.10.2007
  • Lehrform:
  • Belegungsart: Wahlpflichtmodul

Studiengänge

  • IT-Systems Engineering BA

Beschreibung

Im Rahmen dieses Projektseminars soll die Personensuchmaschine www.ProminentPeople.info entwickelt werden. Gefunden werden sollen Informationen zu Personen insbesondere der vollständige Name mit Alter und Titel. Das System nutzt dabei Newsfeeds, Blogs und Wikipedia und findet in diesen Quellen Eigennamen von Personen sowie Zusatzinformationen wie das Alter oder den Titel (Diplom/Doktor/Professor).

In diesem Projektseminar wird insbesondere das Thema Named Entity Recognition (NER) behandet: Es sollen Techniken zum Erkennen von Eigennamen und anderen Named Entities in Texten entwickelt und implementiert werden. Dabei müssen die entwickelten Techniken u.a. Schwierigkeiten wie Mehrdeutigkeiten oder Abkürzungen in Texten bewältigen können.

www.ProminentPeople.info soll in der ersten Version die Suche nach Personen ermöglichen. Das automatisierte Entdecken von Personenbeziehungen ist als Erweiterung geplant.

Die Teilnehmerzahl ist auf 12 Mitglieder beschränkt. Die technische Umsetzung erfolgt mit Java.

Lehrinhalte

  • Named Entity Recognition
  • Mustererkennung / Reguläre Ausdrücke
  • Duplikaterkennung
  • Datenfusion
  • Statistische Analyse
  • Name Clouds

Termine

Dienstags 11:00 - 12:30 in A-1.1
Die Einführungsveranstaltung findet am 16. Oktober 2007 statt.

Zurück