HPI meets DKB

Wie die DKB mit Spark und Deep Learning Millionen von Mails analysiert

In diesem Event der “HPI meets…”-Reihe wird Torsten Nahm, Head of Data Science über die Anwendung von Spark und Deep Learning bei der Deutschen Kreditbank sprechen.

Die DKB hat mehr als 4 Millionen Kunden und erhält über 10.000 Kundenmails pro Tag. Aus dieser Datenmenge lassen sich spannende Erkenntnisse gewinnen und leistungsfähige KI-Modelle entwickeln, welche die semantische Analyse und Kategorisierung der Mails vornehmen und den Customer Support unterstützen. Ein entscheidender Faktor ist dabei die Nutzung eines leistungsfähigen Clusters auf Basis von Spark, das uns erlaubt, Terabytes an Emails schnell und effizient zu verarbeiten.

Auch stellt die menschliche Sprache die KI vor besondere Herausforderungen: sie muss mit der ganzen Komplexität der Sprache umgehen können, inklusive Rechtschreibfehler, Abkürzungen und Kunden, die manchmal selbst nicht genau wissen, was sie wollen. Zum Glück hat sich das Feld des NLP (Natural Language Processing) in den vergangenen Jahren rasant weiterentwickelt und mit modernen Verfahren des Deep Learnings, wie z.B. BERT, lassen sich sehr gute Ergebnisse erzielen.

Doch wie funktionieren diese Verfahren? Und was sind die besonderen Herausforderungen im Umgang mit Emails?

In diesem Vortrag stellt Torsten Nahm die Cloud-Plattform der DKB, die Data Pipelines und natürlich die Machine-Learning-Verfahren vor, die es ermöglichen, aus Millionen von Mails leistungsfähige KI-Modelle zu bauen. Torsten Nahm arbeitet in dem Bereich Digital Products and Technology bei der DKB und leitet das Team Data Science.

Das Event wird als Zoom-Konferenz durchgeführt. Bitte meldet Euch unter dem Anmeldelink an. Wir senden Ihnen rechtzeitig vor der Veranstaltung einen Zoom-Einwahllink.