Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
Login
 

Big Data Analytics Lab (Sommersemester 2018)

Dozent: , Thomas Goerttler (Knowledge Discovery and Data Mining)

Allgemeine Information

  • Semesterwochenstunden: 4
  • ECTS: 6
  • Benotet: Ja
  • Einschreibefrist: 20.04.2018
  • Lehrform: Projektseminar
  • Belegungsart: Wahlpflichtmodul
  • Maximale Teilnehmerzahl: 12

Studiengänge, Modulgruppen & Module

IT-Systems Engineering BA

Beschreibung

Im Rahmen des Praktikums "Big Data Analytics Lab" wird das

theoretische Wissen aus der Vorlesung "Big Data Analytics" mit Hilfe

gängiger Softwaretools praktisch vertieft. Die Veranstaltung teilt sich

in zwei Blöcke: Einen zum aktuellen Stand der Technik und einen darüber

hinausgehenden Themenblock mit offenen Forschungsfragen. Im ersten Block

wird unter Anlehnung an den KDD-Prozess ein Anwendungsbeispiel für die

Wissensextraktion und Datenexploration in einem Unternehmen

durchgespielt. Das Anwendungsbeispiel stammt aus dem jährlich

stattfindenden Data Mining Cup.

Die Teilnehmer und Teilnehmerinnen des Praktikums treten als Team im

Wettbewerb an. Hierbei werden die verschiedenen Data Mining Verfahren

näher beleuchtet. Der Fokus liegt auf Verfahren zum Clustering, der

Klassifikation sowie der Bestimmung von Frequent Itemsets und

Association Rules. Im zweiten Block wird ein einzelner Schritt im

KDD-Prozess und dessen Schwächen im Stand der Technik betrachtet. Die

Studierenden werden für diese offenen Probleme sensibilisiert und

angeleitet eigene Lösungsansätze zu diesen offenen Forschungsfragen zu

entwickeln. Sowohl das Anwendungsbeispiel als auch die offenen

Forschungsfragen werden in Teams bearbeitet.

Im Praktikum soll

das in der Vorlesung "Big Data Analytics" erlernte Wissen über Data

Mining in die Praxis umgesetzt werden. Dabei sollen die Studierenden

gängige Softwaretools im Bereich Datenanalyse kennenlernen und diese in

einer realen Anwendung einsetzen. Im ersten Teil des Praktikums sollen

die Studierenden mit der Vorverarbeitung von Rohdaten sowie mit den

Analyseschritten im KDD-Prozess vertraut gemacht werden. Sie sollen

lernen wie man mit handelsüblichen Analysetools die bestmöglichen

Ergebnisse in einer gegeben Anwendung erzielen kann. Im zweiten Teil des

Praktikums sollen die Schwächen eines einzelnen Analyseschrittes näher

untersucht werden. Die Studierenden werden mit ungelösten Problemen aus

der Fachliteratur konfrontiert und lernen Lösungen dazu selbst zu

entwickeln. Darüber hinaus sollen die Studierenden lernen, im Team

zusammenzuarbeiten, um die einzelnen Aufgaben erfolgreich zu lösen.

Voraussetzungen

Bestandene Klausur in Big Data Analytics.

Teilnehmer werden auf Grund des hohen Andrangs, der beschränkten Kapazitäten und der nahen Deadline des Data Mining Cups in der ersten Sitzung (09. April 2018) ausgelost.

Literatur

  • Data Mining: Concepts and Techniques (3rd edition): Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011 (online verfügbar)
  • Data Mining and Analysis, Fundamental Concepts and Algorithms: Mohammed J. Zaki, Wagner Meira JR., Campridge University Press 2014 (online verfügbar)
  • Mining of Massive Datasets: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman. Second Edition (2014) (online verfügbar)
  • Introduction to Data Mining: Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison-Wesley 2006
  • Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000

Lern- und Lehrformen

Praktikum (Bachelor Projekt-Seminar)

Leistungserfassung

Die Bewertung der im Praktikum entwickelten Lösungen und der damit

erzielten Ergebnisse erfolgt über schriftliche Ausarbeitungen

(Gewichtung: 5/9) und mündliche Präsentationen (Gewichtung: 4/9) der

Teilnehmer und Teilnehmerinnen. Konkret erfolgt die Leistungserfassung

über ein wöchentlich in Gruppenarbeit aktualisiertes Working Paper sowie

individuelle Vorträge aller Teilnehmenden.

Zurück