Hasso-Plattner-Institut
Prof. Dr. Emmanuel Müller
 

Beschreibung

Der Schwerpunkt der Vorlesung "Big Data Analytics" liegt auf Data Mining Algorithmen zur Wissensextraktion und bildet die einzelnen Schritte des Knowledge Discovery in Databases (KDD) Prozess ab. Es werden die grundsätzlichen Data Mining Problemstellungen vorgestellt und verschiedene algorithmische Lösungen aus jedem Bereich verglichen. Darüber hinaus werden grundsätzliche Evaluierungsmethoden vorgestellt, um diese Data Mining Lösungen für konkrete Anwendungen bewerten zu können.

Die Vorlesung umfasst:

  • Grundlagen der Statistik
  • Clustering
  • Classification
  • Frequent Itemset Mining

Veranstaltungsplan

Die Vorlesung findet 2x wöchentlich statt:

  • Mittwochs 15:15 Uhr - 16:45 Uhr (HS1)
  • Freitags 09:15 Uhr - 10:45 Uhr (HS2)

Eine Übung findet in regelmäßigen Abständen Freitags in der Vorlesung statt. Eine Information, welche Termine für die Übung genutzt werden, wird rechtzeitig bekannt gegeben.

Die Folien zur Vorlesung befinden sich jeweils vor der Vorlesung im internen Bereich.

Termine

Vorläufiger Veranstaltungsplan:

Tag
Datum
Anmerkung
Mi19.10
Fr21.100. Übungsstunde (findet statt!)
Mi26.10.
Fr28.10.
Mi2.11.
Fr4.11.1. Übungsstunde
Mi9.11.
Fr11.11.Keine Vorlesung! Verlegt auf Montag!
Mo14.11.Gastvortrag von Prof. Michael Feindt: "Maschinelles Lernen"
(
HS2, 13:30)

Mi

16.11.

Fr18.11.
Mi23.11.Beginn auf 17:00 Uhr verschoben!
Fr25.11.2. Übungsstunde
Mi30.11.
Fr2.12.
Mi7.12.Beginn auf 17:00 Uhr verschoben!
Fr9.12.3. Übungsstunde
Mi14.12.
Fr16.12.
Mi21.12.fällt aus (Weihnachtsferien)
Fr23.12.fällt aus (Weihnachtsferien)
Mi28.12.fällt aus (Weihnachtsferien)
Fr30.12.fällt aus (Weihnachtsferien)
Mi4.1.Beginn auf 17:00 Uhr verschoben!
Fr6.1.
Mi11.1.
Fr13.1.4. Übungsstunde
Mi18.1.
Fr20.1.
Mi25.1.5.Übungsstunde
Fr27.1.
Mi1.2.
Fr3.2.6. Übungsstunde
Mi8.2.Gastvortrag von Prof. Katharina Morik: "Resource Aware Graphical Models" -- entfällt aufgrund des ver.di-Streiks, stattdessen normale Vorlesung
Fr10.2.Fragen und Wiederholung
Mi 22.2Klausur (HS1, 9:00 Uhr)

 

Literatur

  • Data Mining: Concepts and Techniques (3rd edition): Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011 (online verfügbar)
  • Data Mining and Analysis, Fundamental Concepts and Algorithms: Mohammed J. Zaki, Wagner Meira JR., Campridge University Press 2014 (online verfügbar)
  • Mining of Massive Datasets: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman. Second Edition (2014) (online verfügbar)
  • Introduction to Data Mining: Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison-Wesley 2006
  • Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000