Während sich das Potenzial von GPT-4o entwickelt, wagt EvolutionaryScale, ein KI-Forschungslabor, das von ehemaligen Meta-Ingenieuren des nun aufgelösten Protein-Faltungs-Teams gegründet wurde, den Schritt in ein bahnbrechendes Gebiet: die Programmierung von Biologie.
Trotz der erst einjährigen Unternehmensgeschichte erzielt EvolutionaryScale bereits bedeutende Fortschritte. Heute wurde ESM3 enthüllt, ein multimodales generatives Sprachmodell, das in der Lage ist, Aufforderungen zu folgen und neuartige Proteine zu entwerfen. In Tests gelang es ESM3, ein neues grünes fluoreszierendes Protein (esmGFP) zu erzeugen – eine Leistung, die normalerweise Hunderte Millionen Jahre Evolution erfordern würde.
Revolutionierung des Protein-Designs
Das generierte esmGFP weist eine Sequenz auf, die nur zu 58 % mit dem nächstgelegenen bekannten fluoreszierenden Protein übereinstimmt. Das Unternehmen schätzt, dass diese Innovation über 500 Millionen Jahre natürliche Protein-Diversifikation simuliert.
Im Rahmen der Einführung von ESM3 hat EvolutionaryScale 142 Millionen Dollar in einer von namhaften Investoren wie Nat Friedman, Daniel Gross und Lux Capital geleiteten Seed-Finanzierungsrunde gesammelt. Auch die Risikokapitalabteilungen von Amazon und Nvidia haben beigetragen. Das kleinste Modell wurde quelloffen veröffentlicht, um die Forschung in diesem wegweisenden Bereich zu beschleunigen.
Die Herausforderung
Die Entwicklung von ESM3 ist nur der erste Schritt; die Auswirkungen in der realen Welt müssen noch umfassend erforscht werden. EvolutionaryScale verfolgt das Ziel, die Möglichkeiten generativer KI-Modelle zu nutzen, um die grundlegende Sprache des Lebens zu entschlüsseln, wobei der Schwerpunkt auf den zentralen Biologiemolekülen – RNA, Proteine und DNA – liegt, die über 3,5 Milliarden Jahre entwickelt wurden. Durch die Programmierung von Biologie und das Design neuer Moleküle hofft das Unternehmen, bedeutende Herausforderungen wie den Klimawandel, Plastikverschmutzung und Krankheiten, einschließlich Krebs, anzugehen.
Wettbewerbslandschaft
Zahlreiche Organisationen, darunter Google DeepMind und Isomorphic Labs, entwickeln ebenfalls ähnliche Technologien. EvolutionaryScale, gegründet im Jahr 2023, hat mehrere Protein-Sprachmodelle entwickelt, die in ESM3 gipfeln, das sich durch seine Größe und Fähigkeiten auszeichnet.
ESM3 wurde auf einem riesigen Datensatz trainiert – 1 Billion Teraflops Rechenleistung über 2,78 Milliarden natürliche Proteine und 771 Milliarden einzigartige Tokens. Dieses fortschrittliche Modell kann über drei wesentliche biologische Eigenschaften von Proteinen – Sequenz, Struktur und Funktion – reasoning. Benutzer können Teilinformationen zu diesen Aspekten eingeben, und ESM3 generiert Vorhersagen für alle und erstellt letztlich neuartige Proteine.
Erweiterte Kontrolle für Wissenschaftler
„Die multimodale Argumentationsfähigkeit von ESM3 ermöglicht es Wissenschaftlern, neue Proteine mit außergewöhnlicher Kontrolle zu entwickeln. Zum Beispiel kann es Struktur, Sequenz und Funktion integrieren, um Gerüste für Enzyme wie PETase vorzuschlagen, die Plastikmüll abbauen“, erklärte das Unternehmen.
In einem Fall wurde ESM3 eingesetzt, um eine neuartige Version eines grünen fluoreszierenden Proteins zu entwerfen, das Wissenschaftlern ermöglicht, spezifische Proteine innerhalb von Zellen sichtbar zu machen. Bemerkenswerterweise erreicht das generierte Protein die Helligkeit natürlicher fluoreszierender Varianten und hätte 500 Millionen Jahre Evolution benötigt, um sich zu entwickeln.
Ein anpassungsfähiges Modell
Das ESM3-Modell verfügt auch über Selbstverbesserungsfähigkeiten, die es ihm ermöglichen, seine Ausgaben basierend auf Rückmeldungen aus Laborversuchen oder vorhandenen Daten zu verfeinern.
Verfügbarkeit und zukünftige Anwendungen
Derzeit ist ESM3 in drei Größen erhältlich: klein, mittel und groß. Das kleinste Modell mit 1,4 Milliarden Parametern ist quelloffen auf GitHub unter einer nicht-kommerziellen Lizenz verfügbar, während mittlere und große Versionen (bis zu 98 Milliarden Parameter) für kommerzielle Nutzung über die API von EvolutionaryScale und Partnerschaften mit Nvidia und AWS zugänglich sind.
EvolutionaryScale zielt darauf ab, diese Technologie zur Bewältigung globaler Herausforderungen und zur Verbesserung der menschlichen Gesundheit einzusetzen. Ihre vielversprechendsten Anwendungen könnten im Pharmasektor liegen, wo Unternehmen ESM3 nutzen können, um innovative Behandlungen für lebensbedrohliche Erkrankungen zu entwickeln. Frühere Modelle von EvolutionaryScale haben bereits Erfolge bei der Verbesserung von Antikörpermerkmalen und der Erkennung von COVID-19-Varianten gezeigt, was das potenzielle Auswirkungen dieser bahnbrechenden KI auf die Biologie unterstreicht.