Daten sind heutzutage allgegenwärtig. Sie fallen im Internet, bei Geschäftstransaktionen, wissenschaftlichen Experimenten, und vielem mehr an. Diese Flut an Daten kann nicht manuell ausgewertet werden und verlangt nacht automatischer Analyse zur Vorhersage oder Erkennung von Mustern. Neben der Effizienz, die Data Mining Algorithmen aufgrund der Größe der Daten besitzen müssen, spielt auch die Einschätzung der Qualität der Ergebnisse eine wichtige Rolle. Hierfür sind Algorithmen nötig, welche Wahrscheinlichkeiten und Unsicherheiten in den Daten berücksichtigen.
Diese Veranstaltung beschäftigt sich mit den grundlegenden Konzepten der Daten Analyse und des maschinellen Lernens, d.h. dem Lernen anhand von Daten. Wir werden dabei die wichtigsten Algorithmen zur Klassifizierung, Groupierung und Regression, wie zum Beispiel Entscheidungsbäume, Support Vector Machines, und neuronale Netze kennen lernen.
Voraussetzungen
Ein Vorwissen in Wahrscheinlichkeitstheorie und Statistik wird vorausgesetzt, ebenso in linearer Algebra. Eine selbständige Auffrischung dieses Wissens wird von den Studenten, falls nötig, erwartet. Diese Masterveranstaltung richtet sich an interessierte, motivierte Studenten, denen mathematische Formeln keinen Schreck einjagen.
Übungen
Wir haben den Kurs so gestaltet, dass eine praktische Übung das theoretische Wissen der Vorlesung sinnvol ergänzt. Diese enge Einbindung der praktischen Anwendung erlernter theoretischer Konzepte soll in der Übung mit Hilfe der Programmiersprache R erfolgen. Hierfür ist kein Vorwissen von R nötig.