www.ProminentPeople.info (Wintersemester 2007/2008)
Dozent:
Prof. Dr. Felix Naumann
(Information Systems)
Tutoren:
Dr. Alexander Albrecht
Allgemeine Information
- Semesterwochenstunden: 2
- ECTS: 3
- Benotet:
Ja
- Einschreibefrist: 22.10.2007
- Lehrform:
- Belegungsart: Wahlpflichtmodul
Studiengänge
- IT-Systems Engineering BA
Beschreibung
Im Rahmen dieses Projektseminars soll die Personensuchmaschine www.ProminentPeople.info entwickelt werden. Gefunden werden sollen Informationen zu Personen insbesondere der vollständige Name mit Alter und Titel. Das System nutzt dabei Newsfeeds, Blogs und Wikipedia und findet in diesen Quellen Eigennamen von Personen sowie Zusatzinformationen wie das Alter oder den Titel (Diplom/Doktor/Professor).
In diesem Projektseminar wird insbesondere das Thema Named Entity Recognition (NER) behandet: Es sollen Techniken zum Erkennen von Eigennamen und anderen Named Entities in Texten entwickelt und implementiert werden. Dabei müssen die entwickelten Techniken u.a. Schwierigkeiten wie Mehrdeutigkeiten oder Abkürzungen in Texten bewältigen können.
www.ProminentPeople.info soll in der ersten Version die Suche nach Personen ermöglichen. Das automatisierte Entdecken von Personenbeziehungen ist als Erweiterung geplant.
Die Teilnehmerzahl ist auf 12 Mitglieder beschränkt. Die technische Umsetzung erfolgt mit Java.
Lehrinhalte
- Named Entity Recognition
- Mustererkennung / Reguläre Ausdrücke
- Duplikaterkennung
- Datenfusion
- Statistische Analyse
- Name Clouds
Termine
Dienstags 11:00 - 12:30 in A-1.1
Die Einführungsveranstaltung findet am 16. Oktober 2007 statt.
Zurück