Hasso-Plattner-Institut25 Jahre HPI
Hasso-Plattner-Institut25 Jahre HPI
Login
 

Methods & Techniques for Visual Analytics (Sommersemester 2023)

Lecturer: Prof. Dr. Jürgen Döllner (Computergrafische Systeme) , Willy Scheibel (Computergrafische Systeme) , Tim Cech (Computergrafische Systeme) , Adrian Jobst (Computergrafische Systeme) , Daniel Atzberger (Computergrafische Systeme)

General Information

  • Weekly Hours: 4
  • Credits: 6
  • Graded: yes
  • Enrolment Deadline: 01.04.2023 - 07.05.2023
  • Teaching Form: Seminar / Project
  • Enrolment Type: Compulsory Elective Module
  • Course Language: German
  • Maximum number of participants: 15

Programs, Module Groups & Modules

IT-Systems Engineering MA
Data Engineering MA
  • DANA: Data Analytics
    • HPI-DANA-K Konzepte und Methoden
  • DANA: Data Analytics
    • HPI-DANA-T Techniken und Werkzeuge
  • DANA: Data Analytics
    • HPI-DANA-S Spezialisierung
  • DAPP: Data Applications
    • HPI-DAPP-K Konzepte und Werkzeuge
  • DAPP: Data Applications
    • HPI-DAPP-T Techniken und Werkzeuge
  • DAPP: Data Applications
    • HPI-DAPP-S Spezialisierung

Description

Gegenstand dieses Seminars sind die Erarbeitung und teilweise softwaretechnische Umsetzung von Methoden, Verfahren und Techniken zur Prozessierung und interaktiven Visualisierung von Daten im Kontext von Visual Analytics. In diesem Seminar werden Forschungsfragestellungen im Bereich der Visual Analytics theoretisch und praktisch in Form von Projekten und wissenschaftlichem Reporting bearbeitet. Im Rahmen der eigenen Interessen kann aus unterschiedlichen Forschungsthemen des Fachgebietes ein Thema gewählt werden. Dabei kann das Projekt je nach Interesse und Thema stärker auf Erfassung, Aufbereitung oder Visualisierung fokussieren.

Das Seminar befähigt Studierende u.a.
− grundlegende Konzepte der Visual Analytics und Visualisierung anzuwenden;
− spezielle Visualisierungsverfahren und -techniken auf eigene Anwendungsfälle anzuwenden;
− aktuelle Forschung im Bereich Visual Analytics und Visualisierung einzuordnen;
− und über eigene Arbeiten und Ergebnisse zu referieren und zu schreiben.

Im Rahmen des Seminars soll jeweils ein Softwareprototyp erstellt, erweitert oder ausgewertet werden. Weiterhin soll ein vertieftes Verständnis der Techniken geschaffen werden und die wissenschaftsliche Kommunikation geübt werden. Die Projektthemen werden vorrangig in Einzelarbeit bearbeitet. Konkrete Themenvorschläge werden mit der ersten Veranstaltung ausgegeben. Die Projektthemen sind aktuell bearbeiteten Anwendungsfeldern des Fachgebiets zugeordnet (Explainable AI, Information Visualization, Business Analytics, Software Analytics).

Beispiele für Projekte:
− Erweiterung eines CSV-Parsers für die Verarbeitung hierarchischer Datensätze für Hierarchievisualisierungstechniken
− Konzeption und Implementierung eines Web-Services für Dimensionsreduktionen "as a Service"
− Evaluation der Qualität von Layouts nach Dimensionsreduktion auf hochdimensionalen Daten
− Vermessen von Softwareentwicklungsprozessen und Kommunikation der Entwicklungen mithilfe von Informationslandschaften
− Visualisierung der Ähnlichkeit von Nahrungsmitteln
− Erklärungsfindung für Entscheidungen von Classifiern

Es können auch eigene Themenvorschläge eingebracht werden, die nach Passgenauigkeit zum Fokus des Seminars, möglicher Betreuung und fachlichen Zielen feinabgestimmt und dann zur Bearbeitung ausgegeben werden werden können.

 

Hintergrund der Visual Analytics

Wir leben im Zeitalter von "Big Data" und mit "data is the new oil" (Humby, 2006) als geflügeltem Wort kann man unseren bisherigen Umgang mit Daten umreißen. In vielen Bereichen unseres Lebens, z.B. Forschung, Wirtschaft, Industrie, Verwaltung, Gesellschaft und auch im privaten Bereich werden Daten in großen und größten Mengen erfasst und gespeichert. Hier herrscht die Hoffnung, dass diese einen Wert haben oder haben werden, denn "data must be [...] broken down, analyzed for it to have value" (Palmer, 2006). Mit der softwaregestützten Prozessierung und Analyse von Daten, hin zu Vorhersagen mittels Maschinellem Lernen, können heute schon Softwaresysteme entworfen und betrieben werden, die automatisiert Entscheidungen treffen und Handlungen durchführen. Dabei gibt es Anwendungsfelder, in denen der Prozess jedoch nicht ohne einen Menschen, einen Nutzer, geschehen soll oder kann. Insbesondere in Bereichen, in denen Menschen agieren, Entscheidungen treffen und verantworten müssen, hilft eine datengetriebene Analyse dem Entscheidungsprozess.

Massive Daten für die Verarbeitung durch den Mensch aufzubereiten, um so Datenerkundung und Entscheidungsfindung zu unterstützen, ist der Bereich der Visual Analytics. Die Visual Analytics bedient sich den Bereichen der Datenverarbeitung, -analyse und der -visualisierung um Softwaresysteme zu entwerfen und zu betreiben, die dem Menschen den kognitiven und skalierbaren Zugang zu Daten ermöglichen. Durch Methoden und Techniken aus dem Bereich der Visual Analytics können so menschenfokussierte, aber softwaregestützte Systeme geschaffen werden und Daten in ein neues Modell eingebettet werden. Damit softwaregestützte und ML-gestützte Analysen, Vorhersagen und Empfehlungen belastbar sind und zuverlässig benutzt und eingesetzt werden, wird bei den einsetzenden Systemen eine Nachvollziehbarkeit, Wiederholbarkeit und Erklärbarkeit erwartet. Die hier anfallenden Daten und ihre Visualisierung sind ein eigener Bereich der Visual Analytics und werden für den speziellen Fall der Methoden des Maschinellen Lernen dem Themengebiet der Explainable AI zugeordnet.

Requirements

Das Seminar richtet sich an Studierende im Masterstudiengang Data Engineering und IT-Systems Engineering. Für experimentell orientierte Projektthemen wird auf bestehende Visualisierungskomponenten zurückgegriffen. Darüber hinaus werden Kenntnisse einer Skriptsprache zur Datenverarbeitung (z.B. R oder Python) erwartet. Für Entwicklungsthemen sind dagegen projektabhängig Kenntnisse der objektorientierten Software-Entwicklung, der webbasierten Programmierung (JavaScript, Node.js), der Grundlagen der Computergrafik und auch der Visualisierung (OpenGL, GLSL und WebGL) von Vorteil. Vereinzelt können auch Serverkomponenten Fokus der Themen sein, wofür sich systemnahe Programmierung anbietet (Python, C++, Docker).

Students can participate in German or English.

Literature

Zu jedem Thema gibt es neben den über das Internet frei zugänglichen Informationen eine Reihe aktueller Fachartikel, die bei der Themenvergabe mit ausgegeben werden. Die weitere Recherche von themenspezifischer Literatur ist Teil der Bearbeitung.

Learning

In dem Seminar wird die forschungsnahe Projektarbeit inklusive der wissenschaftlich-technischen Dokumentation und Präsentation gelehrt, wobei die Teilnehmer individuell durch Mitarbeiter des Fachgebiet betreut werden.

Materialien und weitere Termine für Vorträge werden über den Moodle Kurs "Methods & Techniques for Visual Analytics" ausgeteilt, abgestimmt und bekanntgegeben. Es wird von jedem Teilnehmer erwartet, dass er in diesem Kurs eingeschrieben ist.

Examination

Die Leistungspunkte werden erreicht, wenn die Studierenden:

  • über das Themengebiet, die Problemstellung und den geplanten Ansatz einen Motivationsvortrag abhalten (vrsl. 25.05.),
  • erfolgreich ein dem Thema entsprechendes Softwareentwicklungsprojekt (50%) planen und durchführen,
  • erfolgreich die Grundlagen und Ergebnisse in einer schriftlichen Ausarbeitung (~6 Seiten doppelspaltig) zusammenfassen (25%, vrsl. 29.09.),
  • über das Arbeitspaket bzw. einen ausgewählten Aspekt erfolgreich einen Abschlussvortrag halten (25%, vrsl. 14.09.).

Die Leistungserfassung beginnt nach Wahl der Teilnehmer bis zum 28.04. mit der Zuteilung des Seminarthemas (vrsl. 02.05.).

Dates

Das Seminar hat im Stundenplan zwei Slots zugewiesen bekommen, wir werden aber nur den zweiten für unregelmäßige Treffen nutzen.

Die Auftaktveranstaltung mit Einführung, Motivation und Themenvorstellung findet am Donnerstag, den 20.04., um 11:00 Uhr in Seminarraum A-2.1 statt.

Themenwahl soll bis zum 28.04. stattfinden. Mit der Themenzuteilung (vrsl. 02.05.) beginnt der Leistungserfassungsprozess.

Zurück