Informationsintegration
Beschreibung
Informationsintegration ist das Verschmelzen heterogener Informationen verschiedener Quellen zu einem homogenen Gesamtbild. Diese Vorlesung ist eine Einführung in dieses hochaktuelle Thema. Neben den Grundlagen der Informationsintegration, z.B. verteilten Datenbankarchitekturen und integrierende Anfragesprachen, lernen Sie Techniken der materialisierten und virtuellen Integration und deren Optimierung kennen. Darüber hinaus werden Spezialthemen, etwa Anfragebearbeitung, Ontologien, das Verborgene Web und Methoden des Data Cleansing, behandelt.
Veranstaltungsplan
Die Vorlesung findet 2x wöchentlich statt:
- Montags 15:15 - 16:45 in HS 3
- Donnerstags 13:30 - 15:00 in HS 2
Ca. alle zwei Wochen wird der Termin als Übung gestaltet. Die folgende Verteilung der Themen ist noch vorläufig.
| Termin | Thema | Folien |
|---|---|---|
| Mo 14.4.2008 | Einführung | |
| Do 17.4.2008 | Achtung: Verlegt auf 16 Uhr IBM Gastvortrag im HPI Kolloquium | |
Mo 21.4.2008 | Übung: Mashups I | Blatt |
| Do 24.4.2008 | fällt aus | |
Mo 28.4.2008 | Verteilung, Autonomie und Heterogenität | |
| Do 01.5.2008 | --- Maifeiertag --- | |
Mo 05.5.2008 | Verteilung, Autonomie und Heterogenität | |
| Do 08.5.2008 | Materialisierte und virtuelle Integration | |
| Mo 12.5.2008 | --- Pfingstmontag --- | |
| Do 15.5.2008 | Übung: Mashups II | Blatt |
| Mo 19.5.2008 | Gastvortrag: Paolo Missier Data Integration in the Life Sciences | |
| Do 22.5.2008 | Architekturen | |
| Mo 26.5.2008 | Architekturen | |
| Do 29.5.2008 | Übung: Semi-Joins | |
| Mo 02.6.2008 | Schema Mapping | |
| Do 05.6.2008 | Schema Mapping | |
| Mo 09.6.2008 | Gastvorlesung: "Projekt Host-Migration" Thomas Siedenbiedel und Holger Schuster (Schufa) | |
| Do 12.6.2008 | Übung: Competitive Analysis I | Blatt |
| Mo 16.6.2008 | Schema Matching | |
| Do 19.6.2008 | SchemaSQL | pdf |
| Mo 23.6.2008 | Übung: Competitive Analysis II | Blatt |
| Do 26.6.2008 | Global-as-View Modellierung und Anfragebearbeitung | |
| Mo 30.6.2008 | Lokal-as-View Modellierung | |
| Do 03.7.2008 | Übung: IBM Information Server | Blatt |
| Mo 07.7.2008 | Gastvorlesung: "Datenintegration: Theorie und Praxis" Matthias Herrmann und Andreas Pabst (sd&m) | |
| Do 10.7.2008 | Containment & Local-as-View Anfragebearbeitung | |
| Mo 14.7.2008 | Containment & Local-as-View Anfragebearbeitung | |
| Do 17.7.2008 | Ausgewählte Themen der Informationsintegration |
Im Sommersemester 2007 wurde die Vorlesung mittels tele-task aufgezeichnet.
Literatur
Ulf Leser und Felix Naumann: Informationsintegration, dpunkt Verlag, 2006.
Das Buch steht 5x in der Bibliothek und mehrfach bei uns am Lehrstuhl. Außerdem z.B. bei Amazon.de.
In der Vorlesung werde ich auf eine Vielzahl von Fachartikeln verweisen, die zur Vertiefung von Interesse sein können.
Es gibt zudem einige andere (deutsche und englische) Lehrbücher zu dem Thema, die ebenfalls als Studienbegleitung geeignet sind. Empfehlenswert sind
- "Distributed Database Systems" von Özsu und Valduriez
- "Föderierte Datenbanksysteme" von Conrad
Prüfung
Voraussetzung zur Zulassung zur Prüfung ist die erfolgreiche Bearbeitung der Übungsaufgaben.
Am 24.7. und 25.7. finden 30-minütige mündliche Prüfungen in 2er-Gruppen statt. Bitte melden Sie sich rechtzeitig an:office-naumann@hpi.uni-potsdam.de.
Übungsergebnisse
Ergebnisse der Mashup Übungen vom 21. April und 15. Mai
Informationen zu ausgewählten Mashups: