Hasso-Plattner-Institut
  
Hasso-Plattner-Institut
Prof. Dr. Felix Naumann
  
 

Datenfusion - Konsolidierung widersprüchlicher Daten

Hintergrund und Projektbeschreibung

In fast allen größeren Datenbeständen befinden sich Duplikate, also mehrfache Repräsentationen des gleichen Realweltobjekts. Insbesondere im Kundendatenmanagement (CRM) haben Duplikate negative Auswirkungen sowohl für die Kunden als auch für die Unternehmen.

Die FUZZY! Informatik AG bietet bereits Werkzeuge an, mit deren Hilfe solche Duplikate effizient gefunden werden können. Es bleibt nun jedoch dem Unternehmen überlassen, wie systematisch mit solchen Duplikaten umgegangen werden soll.

Nun kommen wir ins Spiel, in dem wir ein Fuisonswerkzeug implementieren, mit dem diese Dupliaktgruppen erfolgreich fusioniert werden. Ziel ist es, so viel Gruppen, wie möglich automatisch zu fusionieren, ohne dass korrekte Informationen verloren gehen. Jedoch wird es nicht möglich sein, alle Duplikatgruppen automatisch zu fusionieren, so dass man noch immer den Menschen benötigt, um die restlichen Gruppen zu bearbeiten.

->  Nähere Informationen