openHPI-Kurs über hochqualitative Trainingsdaten für KI-Systeme

Was „gute“ Trainingsdaten für Anwendungen Künstlicher Intelligenz (KI) ausmacht, will ein kostenloser Onlinekurs verdeutlichen, der am 19. April auf openHPI, der offenen Bildungsplattform des Hasso-Plattner-Instituts, beginnt. Titel des zweiwöchigen Angebots: „KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht“.

openHPI-Kurs „KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht“

Onlinekurs „KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht“

Start: 19. April 2023

Dauer: 2 Wochen

Sprache: Deutsch

Jetzt anmelden!

In dem Gratiskurs geht es darum, wie beim Einsatz Künstlicher Intelligenz gewährleistet werden kann, dass nicht nur die Datenqualität stimmt, sondern auch ethische und juristische Anforderungen erfüllt werden. Kursleiter sind HPI-Professor Felix Naumann, Medienethikerin Dr. Jessica Heesen von der Universität Tübingen, Strafrechts-Professorin Frauke Rostalski von der Universität Köln und Normungsexperte Dr. Sebastian Hallensleben vom Verband der Elektrotechnik, Elektronik und Informationstechnik.

Vermitteln wollen die Expertinnen und Experten, dass es riesige Mengen an passenden und qualitativ hochwertigen Trainingsdaten erfordert, wenn KI gesellschaftlich verträglich genutzt werden soll. Dabei haben Informatik, Recht, Ethik und Normung einen jeweils speziellen Blick auf diese Big-Data-Fragestellung rund um maschinelles Lernen.

Einsteiger ins Thema können lernen, was bei Datensammlung und -verarbeitung beachtet werden sollte, um gute, faire und ausgewogene Trainingsdaten zu verwenden, damit faire KI-Systeme entstehen. Anforderungen sind etwa Diskriminierungsfreiheit, Berücksichtigung von Diversität oder Arbeitnehmerdatenschutz. „Unvollständige, fehlerbehaftete, unpassende oder einseitige Trainingsdaten führen zu unsicheren Modellen“, warnt Professor Naumann, der das HPI-Fachgebiet Informationssysteme leitet. Die Ergebnisse könnten dann letztlich zu Fehlentscheidungen führen.

Aufgezeigt werden soll im Kurs, dass auch die rechtlichen Vorgaben für Test-, Validierungs- und Trainingsdaten im maschinellen Lernen sowie deren Umsetzung in Normen und Standards noch weitgehend ungeklärt sind. Die vier Dozenten des openHPI-Onlinekurses forschen im Rahmen des vom Bundesarbeitsministerium geförderten Projekts KITQAR gemeinsam an dem Thema KI und Datenqualität. Das Forschungskonsortium will bis Ende dieses Jahres praktisch anwendbare Qualitätsstandards für Test-, Validierungs- und Trainingsdaten im Bereich Künstliche Intelligenz entwickeln.