Betreuung

Prof. Felix Naumann, Frank Kaufer, Melanie Weis

Beschreibung

Daten, die in autonomen Informationsquellen gespeichert werden, sind oft unterschiedlich strukturiert, gehorchen also heterogenen Schemata. Insbesondere werden Attribute mit gleicher Bedeutung unterschiedlich benannt ("Vorname" bzw. "first name") und es werden Attribute mit unterschiedlicher Bedeutung gleich benannt ("Name" einer Person vs. "Name" eines Projekts). Schema Matching Methoden dienen zur (semi-) automatischen Generierung von Korrespondenzen zwischen solchen Schemata. Sie versuchen also Attribute gleicher Bedeutung in unterschiedlichen Schemata zu erkennen.

In diesem Seminar betrachten wir verschiedene elementare Techniken des Schema Matchings wie das linguistische Abgleichen von Zeichenketten, Termvergleiche unter Nutzung von Hintergrundwissen oder die Analyse von Schemastrukturen und den eigentlichen Daten. Ferner wollen wir Kombinationen der Basistechniken in bereits existierenden Forschungsprototypen und industriellen Produkten untersuchen und vergleichen.

Weitere Details auf der offiziellen Lehrangebotseite.

Wichtige Termine

Termin	Thema	Folien
24.10.2007 (9 Uhr c.t.)	Einführungsveranstaltung	Folien FN: pdf Folien FK: pdf
06.11.2007	Anmeldefrist

Literatur

Einen guten Überblick zum Thema bietet folgender Artikel:

Rahm, E. and Bernstein, P. 2001. A survey of approaches to automatic schema matching. The VLDB Journal 10, 4 (Dec. 2001), 334-350. [PDF]

Kontakt

Für weiterführende Informationen steht Frank Kaufer zur Verfügung.