Proteine sind das Herzstück der Zellen, und Zellen sind die Bausteine des Lebens. Zu verstehen, wie sich Proteinstrukturen bilden und verändern, ist der Schlüssel zum Verständnis der Biologie. Das ebnet den Weg für eine schnellere Entwicklung neuer Arzneimittel, widerstandsfähigere Nutzpflanzen oder auch die Zersetzung von Kunststoffabfall.
Bis vor kurzem waren Proteinstrukturen aufgrund ihrer dreidimensionalen Form, die aus einem linearen Polymer der Aminosäure-Bausteine des Proteins gefaltet ist, schwer zu verstehen. Die Faltung ermöglicht optimale Wechselwirkungen zwischen den Aminosäuren und das Endergebnis ist ein bisschen wie ein Origami-Modell, nur mit einer Art Perlenschnur statt Papier.
„Die Bestimmung einer Proteinstruktur mithilfe von Experimenten ist arbeitsintensiv und dauert lange. Die Menschheit hat dies in den letzten fünfzig Jahren nur wenige Hunderttausende Mal geschafft, seit die erste Proteinstruktur bestimmt wurde“, erklärt Dr. Chris Bahl, Mitbegründer von AI Proteins, einer Plattform für Arzneimittelforschung. Das klingt gewaltig, aber die Zahl ist winzig im Vergleich zu den Hunderten Millionen möglicher Strukturen, die es gibt. Neben jahrelanger mühsamer Arbeit machte die Bestimmung einer Proteinstruktur häufig auch den Einsatz kostspieliger Techniken wie Röntgenkristallographie und Kryoelektronenmikroskopie erforderlich.
Das änderte sich 2021, als AlphaFold auf den Markt kam, das von DeepMind in Partnerschaft mit dem European Molecular Biology Laboratory (EMBL), einem zwischenstaatlichen Forschungsinstitut, entwickelt wurde. Mithilfe künstlicher Intelligenz kann AlphaFold eine Proteinstruktur aus seiner Aminosäuresequenz mit einer Trefferquote vorhersagen, die „die Fähigkeit der Menschheit weit übertrifft“, so Bahl. Das Tool bietet Zugriff auf über 200 Millionen Proteinstrukturvorhersagen.
Im darauffolgenden Jahr veröffentlichte die Facebook-Muttergesellschaft Meta eine Datenbank, die die prognostizierte Form von 600 Millionen Proteinen aus Bakterien, Viren und Mikroorganismen enthält, die noch nicht charakterisiert waren. Dieser Ansatz basierte auf einem Large Language Model (LLM), das mit der Einführung von ChatGPT Verbreitung fand und aus wenigen Buchstaben oder Wörtern Text vorhersagen kann. Somit lassen sich Proteine sozusagen „automatisch vervollständigen“.
Ein wesentlicher Unterschied zu AlphaFold besteht darin, dass das Sprachmodell keine Informationen über ähnliche Aminosäuresequenzen oder Multiple Sequence Alignments (MSA) benötigt. MSA fragt Proteinsequenz-Datenbanken ab, um ähnliche Sequenzen zu identifizieren, die bereits von lebenden Organismen bekannt sind. Das Sprachmodell dagegen kann die Struktur von Proteinen vorhersagen, die keine Ähnlichkeit mit anderen bekannten Proteinen haben. Das ist ein großer Vorteil bei der Prognose, was mit einem Protein passieren würde, wenn es eine Punktmutation gibt. Den Forschern zufolge ist der Algorithmus nicht so genau wie AlphaFold, aber er ist schneller, sodass Wissenschaftler Strukturen in nur zwei Wochen vorhersagen können. „Ich bin so froh, dass ich als Wissenschaftlerin diese Revolution miterleben darf“, sagt Prof. Edith Heard, Generaldirektorin bei EMBL.
Entscheidend ist, dass Neuentdeckungen breit verfügbar gemacht werden. AlphaFold ist eine Open-Access-Ressource, und Meta hat den Code für die Entwicklung seiner Datenbank veröffentlicht. Durch diesen Ansatz erhalten die Algorithmen eine enorme Reichweite und Technologieunternehmen setzen für deren Entwicklung immer mehr auf öffentliche Datenressourcen: Die Algorithmen von DeepMind konnten nur mit den Daten von EMBL entwickelt werden. „Um daraus wirklich einen Game Changer werden zu lassen, musste der Zugang offen sein, damit alle darauf zugreifen können“, sagt Heard.
Forschung im Turbogang
KI-gestützte Vorhersagen beschleunigen die wissenschaftliche Forschung. Biochemiker an der University of Colorado konnten binnen 15 Minuten eine bakterielle Proteinstruktur bestimmen, nachdem sie es 10 Jahre lang vergeblich versucht hatten. Dieser Durchbruch soll helfen, die Antibiotikaresistenz zu bekämpfen. Wissenschaftler der University of Portsmouth verwenden AlphaFold für die Entwicklung von Enzymen, die Kunststoffe zersetzen können. „Diese können ein Heilmittel für den Planeten sein. Das ist beeindruckend und wer hätte vor einigen Jahren gedacht, dass uns so etwas mit derart hoher Geschwindigkeit gelingt“, sagt Heard.
Ein Team am Karolinska Institut in Schweden hat mithilfe von AlphaFold die Struktur eines Proteins bestimmt, das bakterielle Infektionen im Harntrakt und Magen-Darm-System stoppen könnte. Forscher an der University of Oxford arbeiten an Malaria-Impfstoffen, die auf die einzelnen Phasen des Infektionszyklus des Parasiten abgestimmt sind und helfen, nicht nur die Krankheit zu bekämpfen, sondern auch die weitere Übertragung zu verhindern. Bislang kam eine Impflösung bei Malaria nicht in Frage, da wir es hier mit Hunderten, wenn nicht sogar Tausenden Oberflächenproteinen zu tun haben, die nur schwer zu erreichen sind. AlphaFold hat bei der Identifizierung der Eigenschaften eines Schlüsselproteins, bekannt als Pfs48/45, alle herkömmlichen Methoden in den Schatten gestellt. Dieses Protein ist mitverantwortlich für die Entwicklung des Parasiten im Darm der Malariamücke.
In der pharmazeutischen Forschung werden viel Zeit und Geld für die falschen Angriffspunkte für Wirkstoffe verschwendet; prädiktive KI dagegen erhöht die Chancen, dass neue Arzneimittelkandidaten erfolgreich sind. „Ganze Wissenschaftsbereiche werden florieren, denn früher war diese Forschung einfach zu zeitaufwändig und zu teuer“, sagt Heard von EMBL.
Neurodegenerative Erkrankungen wie Alzheimer und Parkinson sind das Ergebnis einer Fehlfaltung von Proteinen. Diese sind neben anderen Volkskrankheiten wie Diabetes und Krebs nicht unbedingt auf Bakterien oder Viren zurückzuführen, seit Jahrtausenden unsere Erzfeinde, sondern auf Fehlzündungen unseres Körpers. Da die meisten Arzneimittel gezielt auf bestimmte Proteine im Körper wirken, wird der Zugang zu Informationen über die Struktur der fehlgefalteten Proteine die Entdeckung von Wirkstoffen erleichtern und die Entwicklung von Medikamenten ermöglichen, die präzise an das Zielprotein andocken und dessen Funktion verändern. Dr. Bahl ist optimistisch, dass auch in anderen Bereichen als der Medizin Fortschritte erzielt werden, z. B. bei modernen Pestiziden oder landwirtschaftlichen Anwendungen. „Das ist eine Möglichkeit, die Kontrolle über die Biologie zu übernehmen. Die Biologie ist im Wesentlichen durch Proteine bestimmt und die Entwicklung von Proteinen wird uns eine beispiellose Kontrolle über die Biologie geben.“
Einblicke für Investoren
- Laut McKinsey sind rund 270 Unternehmen in der KI-gestützten Arzneimittelforschung tätig. Die meisten sind in den USA ansässig, aber Westeuropa und Südostasien legen nach.
- Die Umsätze am KI-Markt für Arzneimittelforschung beliefen sich 2022 auf geschätzte 0,6 Mrd. US-Dollar Analysten von MarketsAndMarkets gehen davon aus, dass sie mit einer jährlichen Wachstumsrate (CAGR) von 45,7% auf 4 Mrd. US-Dollar bis 2027 steigen werden.
Über Proteine hinaus
Allerdings reagieren nicht alle krankheitsbezogenen Proteine auf Medikamente. Einige sind „nicht therapeutisch erreichbar“, das heißt, die Wirkstoffmoleküle können nicht fest und effektiv an sie andocken. Auch hier kann KI helfen, diesmal durch die Fokussierung auf RNA. RNA ist das entscheidende Bindeglied zwischen DNA – dem Molekül, das unseren genetischen Code enthält und die Blaupause für die Proteine ist, die die Grundlage unseres Lebens bilden – und der tatsächlichen Produktion dieser Proteine. Jede der knapp 100.000 verschiedenen Proteinarten, die von menschlichen Zellen produziert werden, hat ihre eigene RNA-Sequenz, die von der DNA-Sequenz der Zelle übertragen wurde.
An die RNA heranzukommen, bevor die Proteine produziert werden, würde es dem Medikament ermöglichen, das Protein vor oder während seiner Synthese zu verändern. Von Covid-19-Impfstoffen bis hin zu bestimmten Krebsmedikamenten – Millionen Menschen haben bereits von RNA-Präparaten profitiert. Die Möglichkeit, RNA-Formen schnell und präzise auf einem Computer vorherzusagen, wird dazu beitragen, das Verständnis von RNA-Molekülen zu beschleunigen und ihren Einsatz im medizinischen Bereich zu erweitern.
„Der Grund, warum KI für die Vorhersage der RNA-Struktur ein Game Changer ist, liegt darin, dass es in der Vergangenheit große Schwierigkeiten gab, Wirkstoffe zu finden, die so selektiv agieren, dass sie genau die RNA erreichen, um die es geht“, erklärt Dr. Raphael Townsend, CEO und Gründer von Atomic AI. Die Struktur der RNA zu kennen, würde den Prozess daher selektiver machen.
Obwohl die Ergebnisse vielversprechend sind, gibt es noch viel zu tun – sowohl in wissenschaftlicher als auch in regulatorischer Hinsicht. 2017 legte die US-Arzneimittelbehörde FDA den Digital Health Innovation Action Plan auf, um den Zulassungsprozess für digitale Gesundheitsprodukte zu beschleunigen. 2021 wurden dann Leitprinzipien für den Einsatz von maschinellem Lernen in Medizinprodukten herausgegeben, ausgearbeitet von der FDA sowie den Regulierungsbehörden in Kanada und Großbritannien.
Bisher gibt es keine Leitlinien für den spezifischen Einsatz von KI in der Pharmaproduktion. Die FDA hat jedoch ein Diskussionspapier veröffentlicht, in dem Überlegungen zur Entwicklung von Richtlinien im Bereich KI diskutiert und die stärkere Einbindung der Öffentlichkeit, der Industrie und der Forschungszentren angeregt wurden. „Das müssen die Regulierungsbehörden schnell organisieren, denn klinische Studien werden langsam zu einem Engpassfaktor und schränken uns in unseren Möglichkeiten zur Herstellung neuer Arzneimittel ein“, warnt Bahl von AI Proteins.
Doch sein Optimismus überwiegt und er hofft, dass für die Medizin eine neue Zeit anbricht. Für ihn ist prädiktive KI in der Biologie Teil einer „Renaissance in den Künsten und Wissenschaften auf jedem Gebiet – KI, biomedizinische Forschung, Astrophysik. Alles geschieht in Synergie, und die Fortschritte in der Computing-Technologie gehen Hand in Hand mit den Fortschritten in der Labortechnik und Automatisierung.“