Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
 

27.06.2008

Potsdam. Sieben Bachelorstudenten haben für die IBM-Software „IBM InfoSphere Information Server“ neue Methoden zur Reinigung sehr großer Datenmengen implementiert. Die Lösung hilft großen Unternehmen und Organisationen, ihren stetig wachsenden Datenbestand zu verwalten. Damit wird eine vollkommen automatisierte „Datenreinigung“ in wenigen Minuten ermöglicht. Das Ergebnis des Projektes, welches in Zusammenarbeit mit IBM Deutschland durchgeführt wurde, ist am 27. Juni beim „Bachelorpodium“ zu dem rund 200 Entscheider aus Politik, Wirtschaft, Wissenschaft und Gesellschaft nach Potsdam gekommen waren, vorgestellt worden.

„Fast jeder kennt das Problem, dass mehrere identische Kataloge in seinem Briefkasten landen“, erklärte Peter Faymonville, Sprecher des Studententeams. Solche Dubletten in der Datenhaltung treten besonders bei der Fusion zweier Unternehmen auf – etwa wenn es zwei Datensätze ein und desselben Kunden gibt, weil einem Mitarbeiter bei der Dateneingabe ein Schreibfehler, zum Bespiel beim Nachnamen, unterlaufen war. Solche Probleme bei der „Datenqualität“ werden häufig noch manuell gelöst, was bei großen Datenmengen sehr zeitaufwändig und damit teuer ist.

Um die Anzahl der manuellen Eingriffe zu reduzieren, bereitete das Studententeam die neuesten Ergebnisse der Informatik-Forschung auf, wie Erkennung und Zusammenführung von Dubletten mittels IT-Lösungen automatisch erfolgen kann. Anschließend integrierte sie die Verfahren in die Software „IBM InfoSphere Information Server“ des Projektpartners IBM. „Mit dem aktuellen Stand der Forschung erreichen wir jetzt höhere Qualität und Geschwindigkeit bei der automatischen Datenreinigung“, betonte Faymonville.

 Betreut wurde die Bachelorprojektgruppe von Prof. Felix Naumann, dem Leiter des HPI-Fachgebiets „Informationssysteme“. Wie auch bei diesem Projekt konzentriert sich das Fachgebiet bei Forschung und Lehre auf die Analyse und Aufbereitung von Datensätzen mit dem Ziel, die Qualität der Daten zu verbessern.

Bachelorpodium – Ausweis der praxisnahen Ausbildung am HPI

Beim „Bachelorpodium“ des Hasso-Plattner-Instituts präsentieren Bachelorstudenten seit 2005 jedes Jahr einer interessierten Öffentlichkeit die Ergebnisse ihrer Praxis-Projekte, die sie in Teams von vier bis acht Studenten am Ende ihres Bachelorstudiums absolviert haben. Sie zeigen, wie sie zwei Semester lang - von ihren Professoren angeleitet - größere praktische Aufgaben der Informationstechnologie eigenverantwortlich angepackt und welche innovativen Lösungen für Wirtschaft und Gesellschaft sie dabei entwickelt haben. Projektgeber sind renommierte Unternehmen und Institutionen aus ganz Deutschland. Eine Übersicht über die laufenden Projekte gibt die HPI-Internetseite http://www.hpi.uni-potsdam.de/lehre/studienprojekte/bachelorprojekte.html.

Kurzprofil Hasso-Plattner-Institut

Das Hasso-Plattner-Institut für Softwaresystemtechnik GmbH (HPI) in Potsdam ist Deutschlands universitäres Exzellenz-Zentrum für IT Systems Engineering. Als einziges Universitäts-Institut in Deutschland bietet es den Bachelor- und Master-Studiengang „IT-Systems Engineering“ an – eine praxisnahe und ingenieurwissenschaftlich orientierte Alternative zum herkömmlichen Informatik-Studium, die von derzeit circa 400 Studenten genutzt wird. Insgesamt 50 Professoren und Dozenten sind am HPI tätig. Es betreibt exzellente universitäre Forschung – auch für erste Adressen der Wirtschaft. Vor allem geht es um Grundlagen und Anwendungen für große, hoch komplexe und vernetzte IT-Systeme.

Hinweis für Redaktionen:
Gerne stellen wir für Interviews Kontakt zu den Studenten her. Druckfähige Bilder der Veranstaltung und der Bachelorstudenten mailen wir Ihnen auf Nachfrage gerne zu!