Big Data Analytics Lab (Sommersemester 2018)
Dozent:
,
Thomas Goerttler
(Knowledge Discovery and Data Mining)
Allgemeine Information
- Semesterwochenstunden: 4
- ECTS: 6
- Benotet:
Ja
- Einschreibefrist: 20.04.2018
- Lehrform: Projektseminar
- Belegungsart: Wahlpflichtmodul
- Maximale Teilnehmerzahl: 12
Studiengänge, Modulgruppen & Module
- BPET: Business Process & Enterprise Technologies
- BPET: Business Process & Enterprise Technologies
- OSIS: Operating Systems & Information Systems Technology
- OSIS: Operating Systems & Information Systems Technology
Beschreibung
Im Rahmen des Praktikums "Big Data Analytics Lab" wird das
theoretische Wissen aus der Vorlesung "Big Data Analytics" mit Hilfe
gängiger Softwaretools praktisch vertieft. Die Veranstaltung teilt sich
in zwei Blöcke: Einen zum aktuellen Stand der Technik und einen darüber
hinausgehenden Themenblock mit offenen Forschungsfragen. Im ersten Block
wird unter Anlehnung an den KDD-Prozess ein Anwendungsbeispiel für die
Wissensextraktion und Datenexploration in einem Unternehmen
durchgespielt. Das Anwendungsbeispiel stammt aus dem jährlich
stattfindenden Data Mining Cup.
Die Teilnehmer und Teilnehmerinnen des Praktikums treten als Team im
Wettbewerb an. Hierbei werden die verschiedenen Data Mining Verfahren
näher beleuchtet. Der Fokus liegt auf Verfahren zum Clustering, der
Klassifikation sowie der Bestimmung von Frequent Itemsets und
Association Rules. Im zweiten Block wird ein einzelner Schritt im
KDD-Prozess und dessen Schwächen im Stand der Technik betrachtet. Die
Studierenden werden für diese offenen Probleme sensibilisiert und
angeleitet eigene Lösungsansätze zu diesen offenen Forschungsfragen zu
entwickeln. Sowohl das Anwendungsbeispiel als auch die offenen
Forschungsfragen werden in Teams bearbeitet.
Im Praktikum soll
das in der Vorlesung "Big Data Analytics" erlernte Wissen über Data
Mining in die Praxis umgesetzt werden. Dabei sollen die Studierenden
gängige Softwaretools im Bereich Datenanalyse kennenlernen und diese in
einer realen Anwendung einsetzen. Im ersten Teil des Praktikums sollen
die Studierenden mit der Vorverarbeitung von Rohdaten sowie mit den
Analyseschritten im KDD-Prozess vertraut gemacht werden. Sie sollen
lernen wie man mit handelsüblichen Analysetools die bestmöglichen
Ergebnisse in einer gegeben Anwendung erzielen kann. Im zweiten Teil des
Praktikums sollen die Schwächen eines einzelnen Analyseschrittes näher
untersucht werden. Die Studierenden werden mit ungelösten Problemen aus
der Fachliteratur konfrontiert und lernen Lösungen dazu selbst zu
entwickeln. Darüber hinaus sollen die Studierenden lernen, im Team
zusammenzuarbeiten, um die einzelnen Aufgaben erfolgreich zu lösen.
Voraussetzungen
Bestandene Klausur in Big Data Analytics.
Teilnehmer werden auf Grund des hohen Andrangs, der beschränkten Kapazitäten und der nahen Deadline des Data Mining Cups in der ersten Sitzung (09. April 2018) ausgelost.
Literatur
- Data Mining: Concepts and Techniques (3rd edition): Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011 (online verfügbar)
- Data Mining and Analysis, Fundamental Concepts and Algorithms: Mohammed J. Zaki, Wagner Meira JR., Campridge University Press 2014 (online verfügbar)
- Mining of Massive Datasets: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman. Second Edition (2014) (online verfügbar)
- Introduction to Data Mining: Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison-Wesley 2006
- Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000
Lern- und Lehrformen
Praktikum (Bachelor Projekt-Seminar)
Leistungserfassung
Die Bewertung der im Praktikum entwickelten Lösungen und der damit
erzielten Ergebnisse erfolgt über schriftliche Ausarbeitungen
(Gewichtung: 5/9) und mündliche Präsentationen (Gewichtung: 4/9) der
Teilnehmer und Teilnehmerinnen. Konkret erfolgt die Leistungserfassung
über ein wöchentlich in Gruppenarbeit aktualisiertes Working Paper sowie
individuelle Vorträge aller Teilnehmenden.
Zurück