Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
 

Duplikaterkennung (Sommersemester 2008)

Lecturer: Prof. Dr. Felix Naumann (Information Systems)

General Information

  • Weekly Hours: 4
  • Credits: 6
  • Graded: yes
  • Enrolment Deadline: 02.05.2008
  • Teaching Form:
  • Enrolment Type: Compulsory Elective Module

Programs

  • IT-Systems Engineering MA

Description

Das Ziel des Seminars ist die ausführliche Beschreibung, Implementierung und Evaluierung bekannter Methoden der Duplikaterkennung für relationale Daten. Die Teilnehmer lernen kennen:

  • Ähnlichkeitsmaße
  • Datenkonflikte
  • Algorithmen zum Umgang mit großen Datenmengen
  • Evaluierungsmaße wie precision und recall

Requirements

  • Grundkenntnisse im Bereich Datenbanken (z.B. DBS I)
  • Die Teilnahme am Workshop "Datenreinigung" wird empfohlen, ist jedoch keine Voraussetzung.

Literature

siehe Webseite

Learning

  • Projektseminar
  • Die Teilnehmerzahl ist auf 16 begrenzt. Interessierte erscheinen bitte einfach zum ersten Termin.

Examination

  • Vortrag über eine ausgewählte Methode der Duplikaterkennung
  • Implementierung und ausführliche Evaluation der Methode
  • Ca. 3 Seiten Beschreibung der Methode in einem Wiki

Dates

Mittwochs 17 Uhr in A-1.2

Zurück