Proteine steuern die meisten Prozesse in lebenden Zellen und sind für den Menschen lebenswichtig. Würde es gelingen, das Proteom des Menschen zu entschlüsseln, also sämtliche Proteine im Organismus genau zu bestimmen, wären Krankheiten wie Alzheimer oder Krebs besser und individueller therapierbar.
Das gemeinsam von HPI-Wissenschaftlern und Forschenden des Boston Child Hospital entwickelte Deep-Lerning-Modell 'Ad hoc learning of fragmentation' (AHLF), wurde auf Massenspektren mit knapp 20 Millionen Datenpunkte trainiert und konnte die Phosphopeptid-Identifizierungen um bis zu 15 Prozent gegenüber herkömmlichen Methoden verbessern.
Neben der genaueren Analyse und Auswertung von Proteinen ist auch die Interpretierbarkeit von AHLF ein weiterer Vorteil.
„Im Vergleich zu vielen anderen Ansätzen ist AHLF keine Blackbox, sondern interpretierbar. Es ist also transparent, wie genau AHLF in den Massenspektren Muster von Proteinen erkennt, die bisher teils weniger oder noch gar nicht erforscht wurden“,
so Professor Bernhard Renard, der das Fachgebiet Data Analytics and Computational Statistics am HPI leitet.
Das Projekt wurde gefördert durch die Deutsche Forschungsgemeinschaft, die International Max Planck Research School for Biology and Computation und die vom BMBF geförderte de.NBI Cloud.