Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
Login
 

Schema Matching (Wintersemester 2007/2008)

Dozent: Prof. Dr. Felix Naumann (Information Systems)

Allgemeine Information

  • Semesterwochenstunden: 4
  • ECTS: 6
  • Benotet: Ja
  • Einschreibefrist: 07.11.2007
  • Lehrform:
  • Belegungsart: Wahlpflichtmodul

Studiengänge

  • IT-Systems Engineering MA

Beschreibung

Daten, die in autonomen Informationsquellen gespeichert werden, sind oft unterschiedlich strukturiert, gehorchen also heterogenen Schemata. Insbesondere werden Attribute mit gleicher Bedeutung unterschiedlich benannt ("Vorname" bzw. "first name") und es werden Attribute mit unterschiedlicher Bedeutung gleich benannt ("Name" einer Person vs. "Name" eines Projekts). Schema Matching Methoden dienen zur (semi-) automatischen Generierung von Korrespondenzen zwischen solchen Schemata. Sie versuchen also Attribute gleicher Bedeutung in unterschiedlichen Schemata zu erkennen.

In diesem Seminar betrachten wir verschiedene elementare Techniken des Schema Matchings wie das linguistische Abgleichen von Zeichenketten, Termvergleiche unter Nutzung von Hintergrundwissen oder die Analyse von Schemastrukturen und den eigentlichen Daten. Ferner wollen wir Kombinationen der Basistechniken in bereits existierenden Forschungsprototypen und industriellen Produkten untersuchen und vergleichen.

Literatur

Einen guten Überblick zum Thema bietet folgender Artikel:

Rahm, E. and Bernstein, P. 2001. A survey of approaches to automatic schema matching. The VLDB Journal 10, 4 (Dec. 2001), 334-350. [PDF]

Lern- und Lehrformen

Im Seminar soll insbesondere wissenschaftliche Kollaboration zur gemeinsamen Erschließung eines kohärenten Themengebiets erprobt werden. Sowohl der Vortrag als auch die Ausarbeitung sollen vornehmlich dem gegenseitigen Vermitteln von Inhalten dienen (Tutorialstil). Dementsprechend wird die Ausarbeitung in einem Wiki stattfinden, wobei die Seminarteilnehmer untereinander überlappende Themen aufteilen, gemeinsam bearbeiten und diskutieren müssen.

Leistungserfassung

Die Leistungserfassung setzt sich aus der Bewertung folgender Aspekte zusammen:

  • Ausarbeitung im SeminarWiki und/oder Wikipedia
  • Vorbereiten und Halten eines Vortrags
  • Praktische Arbeit, je nach Thema eine der folgenden Tätigkeiten:
    • Erstellen von Beispieldatensätzen
    • Implementierung von Demoanwendungen
    • Evaluation von existierenden Systemen

Termine

24.10.2007
(9 Uhr c.t.)
Einführungsveranstaltung
06.11.2007Anmeldefrist

Zurück