Aus dem ständig anschwellenden Meer an digitalen Informationen ein Mehr an Erkenntnissen gewinnen – welche hochentwickelten Verarbeitungsmethoden dabei unterstützen, zeigt ein neuer kostenloser Onlinekurs des Hasso-Plattner-Instituts (HPI). Er startet am 16. April auf der Internetbildungsplattform openHPI und trägt den Titel „Information Service Engineering“. Geleitet wird der sechswöchige Kurs in englischer Sprache von Harald Sack, lange Zeit Senior Researcher am HPI und nun Professor am Karlsruher Institut für Technologie (KIT). Anmelden kann man sich unter https://open.hpi.de/courses/semanticweb2017.
Sack und seine Kollegin Dr. Maria Koutraki wollen die Kursteilnehmer vor allem vertraut machen mit Techniken der Verarbeitung natürlicher Sprache und miteinander verbundener Daten. Gerichtet ist das Angebot, das wöchentlich rund vier Stunden Bearbeitungsaufwand erfordert, nicht nur an Informatikstudenten und Daten- sowie Web-Wissenschaftler, sondern auch an jeden, der sich für die Kombination von semantischer Suche und maschinellem Lernen interessiert.
„Weil Informationen heute praktisch grenzenlos verfügbar sind, benötigen wir zur Bewältigung dieser Fülle Suchmaschinen und intelligente Programme zur Verarbeitung“, sagt Sack. Wichtig sei es, beim Suchen und inhaltlichen Verknüpfen von Wissen immer vollständigere, genauere und zuverlässigere Ergebnisse zu erzielen – auch dadurch, dass Systeme sich bei Fehlern selbst korrigieren.
Bevor Sack an die Universität in Karlsruhe berufen wurde, war er Senior Researcher am Potsdamer HPI. In dem Onlinekurs will er mit Methoden bekanntmachen, die rohe Daten in gut strukturiertes neues Wissen überführen. „Wir zeigen, wie zum Beispiel natürliche Sprachtexte durch statistische Modelle und maschinelles Lernen analysiert und die darin enthaltenen Informationen mit Hilfe formaler Wissensdarstellungen beschrieben werden können“, erläutert der Kursleiter. Er will aber auch verständlich machen, wie etwa automatische Bilderkennung und Videoanalyse, das Übersetzen handgeschriebener Botschaften in maschinenlesbare Schrift oder das Vorlesen geschriebenen Texts durch Computerprogramme funktionieren.
Sack wird ferner auf Empfehlungssysteme eingehen, deren Ratschläge nicht nur auf statistischen Analysen beruhen, sondern auch inhaltliche Zusammenhänge berücksichtigen. Er stellt zudem Techniken der explorativen Suche vor, die dem Internetnutzer „zufällige glückliche Entdeckungen“ bescheren.