Hasso-Plattner-Institut
  
Hasso-Plattner-Institut
Prof. Dr. Felix Naumann
  
 

Organisation

Vorlesung: Dr. Ralf Krestel

Übung: Maximilian Jenders

Vorlesung und Übung im Wechsel, jeweils Montags und Mittwochs um 13:30 in Raum D-E 9/10.

Beschreibung

Daten sind heutzutage allgegenwärtig. Sie fallen im Internet, bei Geschäftstransaktionen, wissenschaftlichen Experimenten, und vielem mehr an. Diese Flut an Daten kann nicht manuell ausgewertet werden und verlangt nacht automatischer Analyse zur Vorhersage oder Erkennung von Mustern. Neben der Effizienz, die Data Mining Algorithmen aufgrund der Größe der Daten besitzen müssen, spielt auch die Einschätzung der Qualität der Ergebnisse eine wichtige Rolle. Hierfür sind Algorithmen nötig, welche Wahrscheinlichkeiten und Unsicherheiten in den Daten berücksichtigen.

Diese Veranstaltung beschäftigt sich mit den grundlegenden Konzepten der Daten Analyse und des maschinellen Lernens, d.h. dem Lernen anhand von Daten. Wir werden dabei die wichtigsten Algorithmen zur Klassifizierung, Groupierung und Regression, wie zum Beispiel Entscheidungsbäume, Support Vector Machines, und neuronale Netze kennen lernen.

Voraussetzungen

Ein Vorwissen in Wahrscheinlichkeitstheorie und Statistik wird vorausgesetzt, ebenso in linearer Algebra. Eine selbständige Auffrischung dieses Wissens wird von den Studenten, falls nötig, erwartet. Diese Masterveranstaltung richtet sich an interessierte, motivierte Studenten, denen mathematische Formeln keinen Schreck einjagen.

Übungen

Wir haben den Kurs so gestaltet, dass eine praktische Übung das theoretische Wissen der Vorlesung sinnvol ergänzt. Diese enge Einbindung der praktischen Anwendung erlernter theoretischer Konzepte soll in der Übung mit Hilfe der Programmiersprache R erfolgen. Hierfür ist kein Vorwissen von R nötig.

Literatur

Einführende, vorlesungsbegleitende Bücher

Fortgeschrittene Literatur

Die Folien zur Vorlesung und Übung finden Sie im internen Bereich unter Materialien/FG_Informationssysteme/VL DM/Slides WS 2016/

Zeitplan

KapitelDatumThemaLiteratur
1Introduction 17.10.16What is Data Mining?
19.10.16Introduction to R
24.10.16Explorative Data Analysis
26.10.16Introduction to Statistics
31.10.16Reformationstag
2.11.16Binary Classification
naiveBayes.pdf
7.11.16Binary Classification Lab
2Experiments9.11.16Featurespca.pdf

14.11.16

Features Lab
16.11.16Evaluation
3Geometric Models21.11.16K-MeanskMeans.pdf
23.11.16Evaluation+K-Means Lab
28.11.16Linear RegressionridgeRegression.pdf
30.11.16fällt aus
5.12.16Linear Regression Lab
7.12.16Support Vector Machines 
svm.pdf
12.12.16SVM Lab
14.12.16Decision TreeesdecisionTrees.pdf
Weihnachtsferien
4Logical Models2.1.17Tree Lab
4.1.17Probeklausur + Klausurbesprechung
9.1.17Association Rules
associationRules.pdf
11.1.17AR Lab
5Probabilistic Models16.1.17Logistic Regression
logisticRegression.pdf
18.1.17Logistic Regression Lab
23.1.17Latent Variable Models
em.pdf
25.1.17Latent Lab
6Neural Network Models30.1.17Artificial Neural Networks
1.2.17ANN+Data Analysis Lab
7Summary6.2.17TBD
8.2.17Summary, Q&A
Exam16.2.17HS 2 14:00 - 15:00