Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
 

Datenreinigung (Sommersemester 2007)

Dozent: Prof. Dr. Felix Naumann (Information Systems)
Website zum Kurs: https://hpi.de/pressemitteilungen/2012/global-e-learning-the-china-germany-internet-bridge-turns-ten.html#c3271

Allgemeine Information

  • Semesterwochenstunden: 2
  • ECTS: 3
  • Benotet: Ja
  • Einschreibefrist: 10.05.2007
  • Lehrform:
  • Belegungsart: Wahlpflichtmodul

Studiengänge

  • IT-Systems Engineering MA

Beschreibung

Datenreinigung bezeichnet sowohl das Erkennen als auch das Korrigieren von Daten, die aus verschiedensten Gründen Fehler aufweisen, und somit  geschäftskritische Analysen verfälschen. Typische Fehler sind Rechtschreibfehler, veraltete Daten (Adressen) und mehrfaches Auftreten eines Objekts (eines Kunden).

In diesem Seminar werden verschiedene Kernthemen der Datenreinigung sowohl aus Forschungssicht als auch aus Sicht der Industrie behandelt. Dazu gehören z.B. Data Profiling, das automatische Erkennen von Doubletten, oder das Zusammenführen von Doubletten.

Lern- und Lehrformen

Wöchentliches Seminar (max. 12 Teilnehmer)

Leistungserfassung

Seminarvortrag und Implementierung bzw. Seminarvortrag und schriftliche Ausarbeitung (themenabhängig) zu einem ausgewählten Thema.

Termine

Dienstags, 17:00 - 18:30 Uhr, Raum A-1.2

Zurück