Forschung Proteinfunktionen vorhersagen
16. August 2019
Intelligentes Neuronales Netzwerk zur Forschung an Proteinen
Proteine erfüllen lebensnotwendige Aufgaben im Körper, indem sie zum Beispiel den Stoffwechsel regulieren oder Signale vermitteln. Forscher des Berliner Instituts für Gesundheitsforschung / Berlin Institute of Health (BIH) und der Universität Heidelberg haben nun ein intelligentes Neuronales Netzwerk entwickelt, das mithilfe von Algorithmen vorhersagen kann, welche Funktion ein Protein übernimmt. Mit einem Trick gelang es den Wissenschaftlern, das Netzwerk dabei zu beobachten, wie diese Vorhersagen erstellt werden. Dies gelang beispielsweise bei der CRISPR-Cas9-Genschere. Die Forschungsergebnisse wurden in „Nature Machine Intelligence“ veröffentlicht.
In der biowissenschaftlichen Forschung werden Algorithmen genutzt, um große Datenmengen effizient auf Muster zu untersuchen. Bestimmte Programme können beispielsweise erkennen, welche wiederkehrenden Strukturen in großen Eiweißmolekülen auftreten – und daraus Rückschlüsse ziehen, welche Aufgaben diese Proteine in Zellen übernehmen, etwa als Genschalter oder Signalmolekül. Die Vorhersagen, die solche Algorithmen basierend auf der Abfolge der Proteinbausteine – der Aminosäureketten – treffen, sind mittlerweile erstaunlich genau. Allerdings ist nicht ersichtlich, warum bestimmten Sequenzen eine bestimmte Proteinfunktion zuordnet wird. „Das präzise Wissen, das mit einem lernenden Algorithmus generiert wird, kann nicht direkt abgerufen werden“, sagt Dr. Dominik Niopek, Leiter der Forschungsgruppe „Synthetische Biologie“ am Institut für Pharmazie und Molekulare Biotechnologie (IPMB) der Universität Heidelberg.
Unter der Leitung von Dr. Niopek und Prof. Dr. Roland Eils, Direktor des Zentrums für digitale Gesundheit am BIH und Leiter der Health Data Science Unit an der Medizinischen Fakultät Heidelberg der Universität Heidelberg, hat sich ein Team von Studierenden dieser Problematik bereits 2017 angenommen. Sie entwickelten ein neues Instrument für die Forschung an Proteinen: DeeProtein ist ein intelligentes Neuronales Netzwerk, das aus der Abfolge der Proteinbausteine die Funktion eines Proteins vorhersagen kann. „Wie die meisten lernenden Algorithmen ist auch DeeProtein eine Black Box, deren Arbeitsweise im Verborgenen bleibt“, so Prof. Eils. „Doch mit einem einfachen Trick ist es gelungen, das Netzwerk beim Denken zu beobachten, also einen Teil dieses Wissens direkt abzufragen.“
Zum Einsatz kommt dabei die sogenannte Sensitivitätsanalyse. Nacheinander wird jede einzelne Position in der Abfolge der Proteinbausteine verdeckt, und aus dieser lückenhaften Information berechnet DeeProtein die Funktion des Proteins. Anschließend wird aus der vollständigen Sequenz eine Vorhersage über die Funktion ermittelt und mit den anderen Vorhersageergebnissen verglichen. „So berechnen wir für jede einzelne Position in der Sequenz, wie wichtig diese für die korrekte Vorhersage der Funktion ist, und geben jeder Aminosäure innerhalb der Proteinkette einen Sensitivitätswert für die Proteinfunktion“, sagt Julius Upmeier zu Belzen. Er ist Student im Masterstudiengang Molekulare Biotechnologie am IPMB und Erstautor der Publikation.
Das neue Analyseverfahren nutzten die Forscher dazu, Bereiche in Proteinen zu identifizieren, die für ihre Funktion entscheidend sind. Dies funktionierte für Signalmoleküle, die bei der Krebsentstehung eine Rolle spielen, ebenso wie bei der CRISPR-Cas9-Genschere, die in präklinischen und klinischen Studien getestet wird. „Mit der Sensitivitätsanalyse können wir Proteinbereiche identifizieren, die Veränderungen besser oder weniger gut tolerieren. Das ist ein wichtiger erster Schritt, wenn wir Proteine gezielt verändern möchten, um ihnen neue Funktionen zu übertragen oder unerwünschte Eigenschaften ‚auszuschalten‘“, betont Dr. Niopek, dessen Arbeitsgruppe auch am BioQuant-Zentrum der Universität Heidelberg angesiedelt ist.
Die Forschungsarbeiten wurden von der Klaus Tschira Stiftung, der Deutschen Forschungsgemeinschaft (DFG) und dem Bundesministerium für Bildung und Forschung (BMBF) gefördert.
Originalveröffentlichung
J. Upmeier zu Belzen, T. Bürgel, S. Holderbach, F. Bubeck, L. Adam, C. Gandor, M. Klein, J. Mathony, P. Pfuderer, L. Platz, M. Przybilla, M. Schwendemann, D. Heid, M.D. Hoffmann, M. Jendrusch, C. Schmelas, M. Waldhauer, I. Lehmann, D. Niopek & R. Eils: Leveraging implicit knowledge in neural networks for functional dissection and engineering of proteins. Nature Machine Intelligence 1, 225–235 (2019).