Duplikaterkennung (Sommersemester 2008)
Lecturer:
Prof. Dr. Felix Naumann
(Information Systems)
General Information
- Weekly Hours: 4
- Credits: 6
- Graded:
yes
- Enrolment Deadline: 02.05.2008
- Teaching Form:
- Enrolment Type: Compulsory Elective Module
Programs
- IT-Systems Engineering MA
Description
Das Ziel des Seminars ist die ausführliche Beschreibung, Implementierung und Evaluierung bekannter Methoden der Duplikaterkennung für relationale Daten. Die Teilnehmer lernen kennen:
- Ähnlichkeitsmaße
- Datenkonflikte
- Algorithmen zum Umgang mit großen Datenmengen
- Evaluierungsmaße wie precision und recall
Requirements
- Grundkenntnisse im Bereich Datenbanken (z.B. DBS I)
- Die Teilnahme am Workshop "Datenreinigung" wird empfohlen, ist jedoch keine Voraussetzung.
Literature
siehe Webseite
Learning
- Projektseminar
- Die Teilnehmerzahl ist auf 16 begrenzt. Interessierte erscheinen bitte einfach zum ersten Termin.
Examination
- Vortrag über eine ausgewählte Methode der Duplikaterkennung
- Implementierung und ausführliche Evaluation der Methode
- Ca. 3 Seiten Beschreibung der Methode in einem Wiki
Dates
Mittwochs 17 Uhr in A-1.2
Zurück