Proteine steuern die meisten Prozesse in lebenden Zellen und sind für den Menschen lebenswichtig. Würde es gelingen, das Proteom des Menschen zu entschlüsseln, also sämtliche Proteine im Organismus genau zu bestimmen, wären Krankheiten wie Alzheimer oder Krebs besser und individueller therapierbar.
Wissenschaftlern des Hasso-Plattner-Instituts (HPI) ist es unter Leitung von HPI-Professor Bernhard Renard nun gemeinsam mit anderen Partnern gelungen, durch die Kombination eines Deep-Learning-Modells mit herkömmlichen algorithmischen Methoden, diesem Ziel näher zu kommen. In der neuen Ausgabe des renommierten Wissenschaftsmagazins Nature Machine Intelligence stellen sie 'Ad hoc learning of fragmentation' (AHLF) vor, ein Deep-Learning-Modell, das auf Massenspektren mit knapp 20 Millionen Datenpunkte trainiert wurde und die Phosphopeptid-Identifizierungen um bis zu 15 Prozent gegenüber herkömmlichen Methoden verbessern konnte:
Neben der genaueren Analyse und Auswertung von Proteinen ist auch die Interpretierbarkeit von AHLF ein weiterer Vorteil. „Im Vergleich zu vielen anderen Ansätzen ist AHLF keine Blackbox, sondern interpretierbar. Es ist also transparent, wie genau AHLF in den Massenspektren Muster von Proteinen erkennt, die bisher teils weniger oder noch gar nicht erforscht wurden“, so Professor Bernhard Renard, der das Fachgebiet Data Analytics and Computational Statistics am HPI leitet.
Das Projekt wurde gefördert durch die Deutsche Forschungsgemeinschaft, die International Max Planck Research School for Biology and Computation und die vom BMBF geförderte de.NBI Cloud.