Hasso-Plattner-Institut
Prof. Dr. Felix Naumann
 

Beschreibung

Daten, die in autonomen Informationsquellen gespeichert werden, sind oft unterschiedlich strukturiert, gehorchen also heterogenen Schemata. Insbesondere werden Attribute mit gleicher Bedeutung unterschiedlich benannt ("Vorname" bzw. "first name") und es werden Attribute mit unterschiedlicher Bedeutung gleich benannt ("Name" einer Person vs. "Name" eines Projekts). Schema Matching Methoden dienen zur (semi-) automatischen Generierung von Korrespondenzen zwischen solchen Schemata. Sie versuchen also Attribute gleicher Bedeutung in unterschiedlichen Schemata zu erkennen.

In diesem Seminar betrachten wir verschiedene elementare Techniken des Schema Matchings wie das linguistische Abgleichen von Zeichenketten, Termvergleiche unter Nutzung von Hintergrundwissen oder die Analyse von Schemastrukturen und den eigentlichen Daten. Ferner wollen wir Kombinationen der Basistechniken in bereits existierenden Forschungsprototypen und industriellen Produkten untersuchen und vergleichen.

Weitere Details auf der offiziellen Lehrangebotseite.

Wichtige Termine

TerminThemaFolien
24.10.2007
(9 Uhr c.t.)
Einführungsveranstaltung

Folien FN: pdf
Folien FK: pdf

06.11.2007Anmeldefrist

Literatur

Einen guten Überblick zum Thema bietet folgender Artikel:

Rahm, E. and Bernstein, P. 2001. A survey of approaches to automatic schema matching. The VLDB Journal 10, 4 (Dec. 2001), 334-350. [PDF]

Kontakt

Für weiterführende Informationen steht Frank Kaufer zur Verfügung.