Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
 

Masterprojekt: Duplikaterkennung auf GPUs (Sommersemester 2011)

Lecturer: Prof. Dr. Felix Naumann (Information Systems)

General Information

  • Weekly Hours: 0
  • Credits: 9
  • Graded: yes
  • Enrolment Deadline: 21.02.2011
  • Teaching Form: Project
  • Enrolment Type: Compulsory Elective Module
  • Maximum number of participants: 4

Programs

  • IT-Systems Engineering MA

Description

Duplikaterkennung beschreibt das Auffinden unterschiedlicher Darstellungen gleicher Realwelt-Objekte in einem Datenbestand. Hierzu wird eine Menge von Datensatz-Paaren gebildet und auf diese jeweils eine Ähnlichkeitsfunktion angewendet. Aufgrund der hohen Anzahl von Vergleichen erscheint es sinnvoll, die Ausführung zu parallelisieren.

GPUs erlauben die parallele Ausführung gleicher Operationen auf unterschiedlichen Daten (Datenparallelität). Nachteilig ist jedoch der Aufwand für das Kopieren von Daten zwischen Hauptspeicher und Grafikkartenspeicher. Weiterhin müssen Algorithmen so optimiert werden, dass eine möglichst hohe Anzahl paralleler Prozesse möglich ist.

Aufgrund des enormen Rechenpotentials moderner Grafikkarten ist im Rahmen des Masterprojekts zu untersuchen, inwieweit die Verwendung von GPUs zur Duplikaterkennung geeignet ist und die o.g. Nachteile durch die zusätzliche Rechenleistung im Vergleich zur Ausführung auf der CPU wieder ausgeglichen werden. Es ist eine enorme Leistungssteigerung zu erwarten.

Requirements

Grundkenntnisse zum Thema Duplikaterkennung (z.B. Vorlesung Informationsintegration, Workshop oder Seminar zum Thema Duplikaterkennung) sowie Programmiererfahrungen in C bzw. mit CUDA/OpenCL sind hilfreich.

Literature

Examination

  • Aktive Mitarbeit
  • Präsentationen der Ergebnisse
  • Ausarbeitung eines Papers zur Einreichung bei der ICDE 2012

Zurück