Ein Team von Bioinformatikern der Heinrich-Heine-Universität Düsseldorf (HHU) hat ein Verfahren entwickelt, um mithilfe von KI-Methoden die Wechselzahl (kcat) von Enzymen vorherzusagen. Enzyme sind wichtige Biokatalysatoren in zellulären Stoffwechselprozessen und spielen eine entscheidende Rolle bei der Umwandlung von Substraten in Produkte. Die kcat-Werte sind essenziell, um die Geschwindigkeit dieser Reaktionen quantitativ zu bewerten. Bisher war es zeitaufwendig und teuer, diese Werte experimentell zu bestimmen, wodurch sie für die meisten Reaktionen unbekannt blieben.
Das Team der HHU nutzte Deep Learning-Modelle, um Informationen über Enzyme und die von ihnen katalysierten Reaktionen in numerische Vektoren umzuwandeln. Diese Vektoren wurden dann einem Gradient Boosting-Modell zugeführt, das die kcat-Werte vorhersagt. Das entwickelte Verfahren namens TurNuP erzielte bessere Ergebnisse als bisherige Ansätze und konnte sogar auf Enzyme angewendet werden, die nur eine geringe Ähnlichkeit zu den im Trainingsdatensatz enthaltenen Enzymen aufwiesen.
Frühere Modelle konnten laut der HHU keine sinnvollen Vorhersagen treffen, wenn die Enzymsequenzen weniger als 40 Prozent Übereinstimmung mit den Trainingsenzymen aufwiesen. TurNuP hingegen ermöglichte bereits bei Übereinstimmungen zwischen 0 und 40 Prozent aussagekräftige Vorhersagen.
Die Forschenden der HHU zeigten laut einer Pressemeldung in ihrer Studie, dass die Vorhersagen von TurNuP verwendet werden können, um die Konzentrationen von Enzymen in lebenden Zellen genauer als bisher vorherzusagen. Um das Vorhersagemodell für andere Forschende zugänglich zu machen, wurde ein benutzerfreundlicher Webserver entwickelt, über den kcat-Werte von Enzymen vorhergesagt werden können.
Die Nutzung von Machine Learning- und Deep Learning-Modellen ermöglicht es, komplexe Muster in den Eingabedaten zu erkennen und Vorhersagen zu treffen. Deep Learning-Modelle bestehen aus miteinander verbundenen Schichten künstlicher Neuronen, während Gradient Boosting-Modelle auf der Erstellung vieler Entscheidungsbäume basieren. Trainingsdaten werden verwendet, um diese Modelle anzupassen und die Vorhersagegenauigkeit zu verbessern.
Die Entwicklung von TurNuP und des Webervers sei laut HHU ein bedeutender Schritt, um die Bestimmung von kcat-Werten effizienter und kostengünstiger zu gestalten. Dadurch können zelluläre Stoffwechselprozesse und biotechnologische Anwendungen besser erforscht werden, da die Enzymaktivitäten quantitativ bewertet werden können.
Bild: Pressefoto / Grafik von Heinrich-Heine-Universität Düsseldorf (HHU)