Informationsintegration
Beschreibung
Informationsintegration ist das Verschmelzen heterogener Informationen verschiedener Quellen zu einem homogenen Gesamtbild. Diese Vorlesung ist eine Einführung in dieses hochaktuelle Thema. Neben den Grundlagen der Informationsintegration, z.B. verteilten Datenbankarchitekturen und integrierende Anfragesprachen, lernen Sie Techniken der materialisierten und virtuellen Integration und deren Optimierung kennen. Darüber hinaus werden Spezialthemen, etwa Anfragebearbeitung, Ontologien, das Verborgene Web und Methoden des Data Cleansing, behandelt.
Veranstaltungsplan
Die Vorlesung findet 2x wöchentlich statt:
- Dienstags 9:15 - 10:45 in Raum A-2.1
- Donnerstags 13:30 - 15:00 in Raum A-2.1
Ca. alle zwei Wochen wird der Termin als Übung gestaltet.
Die Veranstaltung wird als tele-task Vorlesung aufgezeichnet.
| Termin | Thema | Folien |
|---|---|---|
| Di 17.4.2007 | Einführung | |
| Do 19.4.2007 | Verteilung, Autonomie und Heterogenität | |
| Di 24.4.2007 | Verteilung, Autonomie und Heterogenität | |
| Do 26.4.2007 | Beispiel & | |
| Di 01.5.2007 | --- Feiertag --- | |
| Do 03.5.2007 | Architekturen | |
| Di 08.5.2007 | Übung: Schnittstellenheterogenität | |
| Do 10.5.2007 | Architekturen | |
| Di 15.5.2007 | Schema Mapping / Matching | |
| Do 17.5.2007 | --- Himmelfahrt --- | |
| Di 22.5.2007 | Schema Mapping / Matching | |
| Do 24.5.2007 | Übung: Schema Matching | Übung Aufgaben |
| Di 29.5.2007 | Schema Mapping | |
| Do 31.5.2007 | SchemaSQL | |
| Di 05.6.2007 | Global-as-View Modellierung und Anfragebearbeitung | pdf |
| Do 07.6.2007 | Lokal-as-View Modellierung | |
| Di 12.6.2007 | Containment & Local-as-View Anfragebearbeitung | |
| Do 14.6.2007 | Übung: GaV / LaV | Übung Aufgaben |
| Di 19.6.2007 | Bucket Algorithmus | |
| Do 21.6.2007 | Achtung: Fällt zugunsten des FutureSOC Symposiums aus. (Verteilte Anfragebearbeitung) | |
| Di 26.6.2007 | Übung: Verteilte Anfragebearbeitung | |
| Do 28.6.2007 | Data Lineage | pdf (28.6.) |
| Di 03.7.2007 | Übung: DWH & ETL | Übung Aufgaben |
| Do 05.7.2007 | Duplikaterkennung | pdf (Melanie Weis) |
| Di 10.7.2007 | Übung: Duplikaterkennung | Übung Aufgaben |
| Do 12.7.2007 | Datenfusion | pdf (Jens Bleiholder) |
| Di 17.7.2007 | Hidden Web | |
| Do 19.7.2007 | Semantic Web |
Literatur
Ulf Leser und Felix Naumann: Informationsintegration, dpunkt Verlag, 2006.
Das Buch steht 5x in der Bibliothek und mehrfach bei uns am Lehrstuhl. Außerdem z.B. bei Amazon.de.
In der Vorlesung werde ich auf eine Vielzahl von Fachartikeln verweisen, die zur Vertiefung von Interesse sein können.
Es gibt zudem einige andere (deutsche und englische) Lehrbücher zu dem Thema, die ebenfalls als Studienbegleitung geeignet sind. Empfehlenswert sind
- "Distributed Database Systems" von Özsu und Valduriez
- "Föderierte Datenbanksysteme" von Conrad
Prüfung
In der ersten Woche nach dem Vorlesungszeitraum finden 30-minütige mündliche Prüfungen statt. Voraussetzung zur Zulassung zur Prüfung ist die erfolgreiche Bearbeitung der Übungsaufgaben.