Hasso-Plattner-Institut
  
Hasso-Plattner-Institut
Prof. Dr. Felix Naumann
  
 

Beschreibung

Informationsintegration ist das Verschmelzen heterogener Informationen verschiedener Quellen zu einem homogenen Gesamtbild. Diese Vorlesung ist eine Einführung in dieses hochaktuelle Thema. Neben den Grundlagen der Informationsintegration, z.B. verteilten Datenbankarchitekturen und integrierende Anfragesprachen, lernen Sie Techniken der materialisierten und virtuellen Integration und deren Optimierung kennen. Darüber hinaus werden Spezialthemen, etwa Anfragebearbeitung, Ontologien, das Verborgene Web und Methoden des Data Cleansing, behandelt.

Veranstaltungsplan

Die Vorlesung findet 2x wöchentlich statt:

  • Dienstags       9:15 - 10:45 in Raum A-2.1
  • Donnerstags 13:30 - 15:00 in Raum A-2.1

Ca. alle zwei Wochen wird der Termin als Übung gestaltet.

Die Veranstaltung wird als tele-task Vorlesung aufgezeichnet.

TerminThemaFolien
Di 17.4.2007Einführungpdf
Do 19.4.2007Verteilung, Autonomie und Heterogenitätpdf
Di 24.4.2007Verteilung, Autonomie und Heterogenität
Do 26.4.2007

Beispiel &
Materialisierte und virtuelle Integration

pdf
pdf

Di 01.5.2007--- Feiertag ---
Do 03.5.2007Architekturenpdf
Di 08.5.2007Übung: Schnittstellenheterogenität

Übung
Aufgaben

Do 10.5.2007Architekturen
Di 15.5.2007Schema Mapping / Matchingpdf
Do 17.5.2007--- Himmelfahrt ---
Di 22.5.2007Schema Mapping / Matching
Do 24.5.2007Übung: Schema MatchingÜbung
Aufgaben
Di 29.5.2007Schema Mapping
Do 31.5.2007SchemaSQLpdf
Di 05.6.2007Global-as-View Modellierung und Anfragebearbeitung

pdf
(5.6.)

Do 07.6.2007Lokal-as-View Modellierungpdf
Di 12.6.2007Containment & Local-as-View Anfragebearbeitung
Do 14.6.2007Übung: GaV / LaVÜbung
Aufgaben
Di 19.6.2007Bucket Algorithmuspdf
Do 21.6.2007Achtung: Fällt zugunsten des FutureSOC Symposiums aus. (Verteilte Anfragebearbeitung)
Di 26.6.2007Übung: Verteilte Anfragebearbeitung

pdf
Übung
Aufgaben

Do 28.6.2007Data Lineagepdf (28.6.)
Di 03.7.2007Übung: DWH & ETLÜbung
Aufgaben
Do 05.7.2007Duplikaterkennungpdf (Melanie Weis)
Di 10.7.2007Übung: DuplikaterkennungÜbung
Aufgaben
Do 12.7.2007Datenfusionpdf (Jens Bleiholder)
Di 17.7.2007Hidden Webpdf
Do 19.7.2007Semantic Webpdf

Literatur

Ulf Leser und Felix Naumann: Informationsintegration, dpunkt Verlag, 2006.

Das Buch steht 5x in der Bibliothek und mehrfach bei uns am Lehrstuhl. Außerdem z.B. bei Amazon.de.

In der Vorlesung werde ich auf eine Vielzahl von Fachartikeln verweisen, die zur Vertiefung von Interesse sein können.

Es gibt zudem einige andere (deutsche und englische) Lehrbücher zu dem Thema, die ebenfalls als Studienbegleitung geeignet sind. Empfehlenswert sind

  • "Distributed Database Systems" von Özsu und Valduriez
  • "Föderierte Datenbanksysteme" von Conrad

Prüfung

In der ersten Woche nach dem Vorlesungszeitraum finden 30-minütige mündliche Prüfungen statt. Voraussetzung zur Zulassung zur Prüfung ist die erfolgreiche Bearbeitung der Übungsaufgaben.