Das Hasso-Plattner-Institut bietet seinen Studierenden ein gebührenfreies und praxisnahes Informatikstudium an einem international renommierten Institut. Zum Studienangebot zählen der deutschlandweit einzigartige Bachelorstudiengang IT-Systems Engineering und die fünf Masterstudiengänge Cybersecurity, Data Engineering, Digital Health, IT-Systems Engineering und Software Systems Engineering.

schließen

Unsere Forschenden am HPI profitieren von einem inspirierenden wissenschaftlichen Umfeld sowie einer kollaborativen und inklusiven Arbeitsatmosphäre. So entstehen Erkenntnisse auf hohem wissenschaftlichen Niveau, die zum Wohl der Gesellschaft beitragen. Unsere wissenschaftliche Arbeit ist in Research Cluster strukturiert. Zudem kooperieren wir in zahlreichen Forschungsprogrammen mit wissenschaftlichen Institutionen, Unternehmen und öffentlichen Einrichtungen auf nationaler und internationaler Ebene.

schließen

Das Hasso-Plattner-Institut in Potsdam ist einzigartig in der deutschen Universitätslandschaft. Unterstützt durch Stifter Hasso Plattner und durch internationale Kooperationen bis hin zum Silicon Valley wächst das Angebot des Instituts stetig weiter. Erfahrt mehr über den Stifter, die Veranstaltungen und das Studium am HPI.

schließen

Auch für Schüler und Berufstätige bietet das Hasso-Plattner-Institut attraktive Bildungsangebote. Mit openHPI betreibt es eine eigene IT-Bildungsplattform mit kostenlosen Online-Kursen. Die Schülerakademie organisiert Informatik-Camps und Veranstaltungen für Schüler. Die HPI Academy bietet Berufstätigen Bildungsangebote im Design Thinking.

Kurse

schließen

Der Pressebereich des Hasso-Plattner-Instituts versorgt Sie regelmäßig mit allen aktuellen Neuigkeiten, Infos zu unseren Social-Media-Kanälen, Kontaktdaten und ausführlichem Pressematerial.

schließen

Home

schließen

Welcome to the website of Prof. Ariel Dora Stern, head of the research group Digital Health, Economics & Policy.

schließen

Application Security: Tools

schließen

CISO Office

schließen

Approximate Data Profiling (Wintersemester 2022/2023)

Dozent: Prof. Dr. Felix Naumann (Information Systems) , Tobias Bleifuß (Information Systems) , Youri Kaminsky
Website zum Kurs: https://hpi.de/naumann/teaching/current-courses/ws-22-23/approximate-data-profiling.html

Allgemeine Information

Semesterwochenstunden: 4
ECTS: 6
Benotet: Ja
Einschreibefrist: 01.10.2022 - 30.10.2022
Prüfungszeitpunkt §9 (4) BAMA-O: 08.12.2022
Lehrform: Projektseminar
Belegungsart: Wahlpflichtmodul
Lehrsprache: Englisch
Maximale Teilnehmerzahl: 6

Studiengänge, Modulgruppen & Module

IT-Systems Engineering MA

Data Engineering MA

DANA: Data Analytics
- HPI-DANA-K Konzepte und Methoden
DANA: Data Analytics
- HPI-DANA-T Techniken und Werkzeuge
DANA: Data Analytics
- HPI-DANA-S Spezialisierung
CODS: Complex Data Systems
- HPI-CODS-K Konzepte und Methoden
CODS: Complex Data Systems
- HPI-CODS-T Techniken und Werkzeuge
CODS: Complex Data Systems
- HPI-CODS-S Spezialisierung

Software Systems Engineering MA

Beschreibung

Data profiling is the process of extracting metadata from datasets. One important aspect is the discovery of data dependencies, such as Functional Dependencies (FDs), Inclusion Dependencies (INDs) and Unique Column Combinations (UCCs). However, the increasing size of datasets presents a challenge to traditional approaches of data profiling. Therefore, this seminar focuses on sampling-based methods for approximate data profiling.

First, the students become familiar with related work as an inspiration. Afterwards, each student team develops own ideas. These can concern both the sampling process itself or the actual discovery in the sample.

The students turn their ideas into working algorithms. There are two main goals for each algorithm:
1) Find a set of dependencies that is close to the actual solution.
2) Minimize the required runtime.
Benchmark Datasets are provided to the students.
Finally, the students present their approaches and write a short report.

Literatur

Data Profiling - Synthesis Lectures on Data Management Ziawasch Abedjan, Lukasz Golab, Felix Naumann, Thorsten Papenbrock, Morgan Claypool, 2019.
Sampling for Big Data Profiling: A Survey. Zhicheng Liu and Aoqian Zhang, IEEE Access, 2020.

Lern- und Lehrformen

Project seminar with weekly meetings, talks, discussions and report writing

Leistungserfassung

Presentation and report

Termine

See webpage.

Zurück

HPI Merch – jetzt online bestellbar

In unserem HPI Shop gibt es ab sofort fair produziertes und zertifiziertes Merchandise wie Pullover und T-Shirts aus Bio-Baumwolle, Taschen, Trinkflaschen, ein löschbares Notizbuch und weitere nachhaltige Accessoires.

Approximate Data Profiling (Wintersemester 2022/2023)

Allgemeine Information

Studiengänge, Modulgruppen & Module

Beschreibung

Literatur

Lern- und Lehrformen

Leistungserfassung

Termine

HPI Merch – jetzt online bestellbar

Termine

07.10.2024 | Workshop "Synergizing Data Engineering for Healthcare Innovation"

16.10.2024 | Young Women in AI Camp

17.10.2024 | Fireside Chat "25 Years HPI - Past, Present, Future"