Duplikaterkennung beschreibt das Auffinden unterschiedlicher Darstellungen gleicher Realwelt-Objekte in einem Datenbestand. Hierzu wird eine Menge von Datensatz-Paaren gebildet und auf diese jeweils eine Ähnlichkeitsfunktion angewendet. Aufgrund der hohen Anzahl von Vergleichen erscheint es sinnvoll, die Ausführung zu parallelisieren.
Die Rechenleistung von GPUs moderner Grafikkarten übersteigt mittlerweile die Rechenleistung von CPUs. So sind beispielsweise in den Top 5 der weltweiten Supercomputer 3 Systeme, die auch GPUs verwenden. Die Anwendungsgebiete für GPUs sind vielfältig und umfassen u.a. Simulationen, Bildbearbeitung und Finanzanwendungen.