IT-Systeme bilden das Rückgrat der verschiedensten Unternehmen und Institutionen. Sie steuern Prozesse und nehmen Überwachungs- und Informationsaufgaben war. IT- gestützte Systeme sind aus dem alltäglichen Leben, wie auch der Geschäftswelt nicht mehr weg zu denken. Seit der Entwicklung der ersten Anwendungen für Unternehmen hat die Technologie einen raschen Wandel erlebt. So bietet die fortgeschrittene Technik heute viel mehr, als die anfangs eingesetzten hoch spezialisierten Insellösungen, die kleine Teile in einem Geschäftsprozess unterstützten. Heute sind viel mehr einheitliche, effiziente und einfach zu bedienende Informationssysteme gefragt, die den Entscheidern in einem Unternehmen eine valide Informationsbasis für strategische Vorhaben zur Verfügung stellen. Solche Systeme stehen in einem Unternehmen nicht Ad-hoc zur Verfügung. Sie müssen in einem komplizierten Prozess aufgebaut werden und die Informationen der einzelnen, im Unternehmen vorhandenen Lösungen integrieren. Die Herausforderung besteht in eben dieser Integration. Unterschiedlichste Architekturen und die zugrunde liegenden Daten müssen vereinheitlicht und zusammengeführt werden. Die polymorphe Gestalt dieser Systeme erschwert dieses Vorhaben erheblich. Daten liegen in den unterschiedlichsten Formaten und semantischen Formen vor. Es gilt diese zu transformieren und in ein einheitliches Format zu bringen. Es erscheint logisch, dass der Qualität dieser Daten eine zentrale Rolle zukommt.
Daten die doppelt vorhanden, unvollständig sind, im falschen Format vorliegen oder informatorisch nicht korrekt sind, bieten eine nur unzuverlässige Basis für ein einheitlich integriertes Informationssystem. Eine solche Datenbasis, die keine ausreichende Reputation erlangt oder die qualitativ minderwertig ist, kann nicht als Entscheidungsgrundlage für wichtige Schritte im Unternehmen herangezogen werden. Unzureichende Datenqualität führt nicht nur zu falschen oder verspäteten Entscheidungen, sondern kann im laufenden Betrieb eines Unternehmens hohe Kosten verursachen.
Die Arbeiten der beiden Autoren beleuchten die geschilderte Thematik eingehend. Im Anschluss stellen Sie ein, während der praktischen Phase dieser Thesis implementiertes, vollständig webbasierendes Werkzeug für die Messung der Datenqualität in heterogenen Datenbeständen vor.