Hasso-Plattner-InstitutSDG am HPI
Hasso-Plattner-InstitutDSG am HPI
  
Login
 

Analysis and Visualization of Software Data (Sommersemester 2020)

Dozent: Prof. Dr. Jürgen Döllner (Computergrafische Systeme) , Willy Scheibel (Computergrafische Systeme) , Daniel Atzberger (Computergrafische Systeme)

Allgemeine Information

  • Semesterwochenstunden: 4
  • ECTS: 6
  • Benotet: Ja
  • Einschreibefrist: 06.04.2020 - 22.04.2020
  • Lehrform: Seminar / Projekt
  • Belegungsart: Wahlpflichtmodul
  • Lehrsprache: Deutsch

Studiengänge & Module

Data Engineering MA
IT-Systems Engineering MA

Beschreibung

Im heutigen Softwareentwicklungsprozess werden Prozesse und Arbeit an Softwaresystemen digital erfasst (Project Management, Bug Tracking, Version Control, Build und Test Pipelines). Diese Daten können mithilfe von Process Mining und Software Data Mining extrahiert und aufbereitet werden. Dabei sind diese Daten in ihrer Struktur komplex und in ihrer Anzahl massiv, sowie andauernder zeitlicher Änderung unterlegen. Aus diesen Daten können dann analytische oder visuelle Ergebnisse zum Monitoring oder Management von Softwareentwicklungsprozessen abgeleitet werden.

In diesem Seminar werden Techniken und Methoden zur Erfassung, Aufbereitung und Visualisierung für die explorative, visuellen Analyse von Datensätzen aus dem Software Engineering untersucht, umgesetzt und erprobt.

Besonderer Fokus bei der Datenerfassung sind dabei Techniken zum Mining von Source Code und Metriken aus Versionsverwaltungssystemen und Prozessen und Metriken aus Projektmanagementplattformen. Für die Datenaufbereitung sollen insbesondere Data Cleansing und Machine Learning thematisiert werden. Im Bereich der Visualisierung soll der Fokus auf der Algorithmik und dem Rendering von Softwarevisualisierungsverfahren wie Treemaps und Topic Maps liegen.

In diesem Seminar werden dazu Forschungs- oder Softwareprojekte vorrangig in Einzelarbeit umgesetzt. Im Rahmen der eigenen Interessen kann aus unterschiedlichen Forschungsthemen des Fachgebietes ein Thema gewählt werden. Dabei kann das Projekt je nach Interesse und Thema stärker auf Erfassung, Aufbereitung oder Visualisierung fokussieren.

Voraussetzungen

Das Seminar richtet sich an Studierende im Masterstudiengang Data Engineering und IT-Systems Engineering. Für experimentell orientierte Projektthemen wird auf bestehende Visualisierungskomponenten zurückgegriffen. Darüber hinaus werden Kenntnisse einer Skriptsprache zur Datenverarbeitung (z.B. R oder Python) erwartet. Für Entwicklungsthemen sind dagegen projektabhängig Kenntnisse der objektorientierten Software-Entwicklung, der webbasierten Programmierung (JavaScript, Node.js), der Grundlagen der Computergrafik und auch der Visualisierung (OpenGL, GLSL und WebGL) von Vorteil. Vereinzelt können auch Serverkomponenten Fokus der Themen sein, wofür sich systemnahe Programmierung anbietet (Python, C++, Docker).

Students can participate in German or English.

Literatur

Zu jedem Thema gibt es neben den über das Internet frei zugänglichen Informationen eine Reihe aktueller Fachartikel, die bei der Themenvergabe mit ausgegeben werden. Die weitere Recherche von themenspezifischer Literatur ist Teil der Bearbeitung.

Als Motivation für das Seminar ist folgender Artikel zur Vorbereitung empfohlen:

Lern- und Lehrformen

Forschungsnahe Projektarbeit mit individueller Betreuung durch das Fachgebiet.

Leistungserfassung

Die Leistungspunkte werden erreicht, wenn die Studierenden:

  • über das Themengebiet, die Problemstellung und den benutzten Ansatz einen Zwischenvortrag abhalten (10%),

  • erfolgreich ein dem Thema entsprechendes Softwareentwicklungsprojekt (40%) planen und durchführen,

  • erfolgreich die Grundlagen und Ergebnisse in einer schriftlichen Ausarbeitung (4 Seiten) zusammenfassen (25%),

  • über das Arbeitspaket bzw. einen ausgewählten Aspekt erfolgreich einen Abschlussvortrag (25%) halten.

Termine

Das Seminar findet im Sommersemester 2020 statt. Wegen der anhaltenden Einschränkungen durch die Bundes- und Landesregierungen, sowie des Hasso-Plattner-Instituts zum Schutz der Studierenden und Mitarbeiter bezüglich SARS-CoV-2, ändert sich der Ablauf des Seminars wie folgt.

Alle interessierten Teilnehmer für das Seminar legen sich einen Account im Moodle des Fachgebiets Computergrafische Systeme an und schreiben sich in die Lehrveranstaltung "Analysis and Visualization of Software Data" ein (zugelassene Email Domains sind @student.hpi.de und @uni-potsdam.de).

Über das Moodle werden rechtzeitig technische Informationen zu der ersten Veranstaltung mitgeteilt, die über ein Telekonferenzsystem, voraussichtlich am Mittwoch, den 29.04.2020 um 09:15 Uhr, erfolgen wird. In dieser Veranstaltung werden die Seminarformalien eingeführt und auch die bearbeitbaren Themen vorgestellt. Alle Informationen sind danach schriftlich im Moodle hinterlegt. Potentielle Teilnehmer können auch ohne vorherige Belegung durch das Studienreferat Interesse an den Themen anzeigen. Eine Belegung kann durch die verbindliche Ausgabe eines Themas nachträglich erfolgen.

Für den weiteren Verlauf des Seminars werden individuelle, virtuelle Treffen mit den Betreuern vereinbart, für Zwischenstands- und Abschlussvorträge werden Termine in Absprache mit den Teilnehmenden festgelegt.

Zurück