Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
 

www.ProminentPeople.info (Wintersemester 2007/2008)

Lecturer: Prof. Dr. Felix Naumann (Information Systems)

General Information

  • Weekly Hours: 2
  • Credits: 3
  • Graded: yes
  • Enrolment Deadline: 22.10.2007
  • Teaching Form:
  • Enrolment Type: Compulsory Elective Module

Programs

  • IT-Systems Engineering BA

Description

Im Rahmen dieses Projektseminars soll die Personensuchmaschine www.ProminentPeople.info entwickelt werden. Gefunden werden sollen Informationen zu Personen insbesondere der vollständige Name mit Alter und Titel. Das System nutzt dabei Newsfeeds, Blogs und Wikipedia und findet in diesen Quellen Eigennamen von Personen sowie Zusatzinformationen wie das Alter oder den Titel (Diplom/Doktor/Professor).

In diesem Projektseminar wird insbesondere das Thema Named Entity Recognition (NER) behandet: Es sollen Techniken zum Erkennen von Eigennamen und anderen Named Entities in Texten entwickelt und implementiert werden. Dabei müssen die entwickelten Techniken u.a. Schwierigkeiten wie Mehrdeutigkeiten oder Abkürzungen in Texten bewältigen können.

www.ProminentPeople.info soll in der ersten Version die Suche nach Personen ermöglichen. Das automatisierte Entdecken von Personenbeziehungen ist als Erweiterung geplant.

Die Teilnehmerzahl ist auf 12 Mitglieder beschränkt. Die technische Umsetzung erfolgt mit Java.

Lehrinhalte

  • Named Entity Recognition
  • Mustererkennung / Reguläre Ausdrücke
  • Duplikaterkennung
  • Datenfusion
  • Statistische Analyse
  • Name Clouds

Dates

Dienstags 11:00 - 12:30 in A-1.1
Die Einführungsveranstaltung findet am 16. Oktober 2007 statt.

Zurück