Alors que le potentiel de GPT-4o progresse, EvolutionaryScale, un laboratoire de recherche en IA fondé par d'anciens ingénieurs de Meta issus de l'équipe de pliage des protéines désormais dissoute, s'aventure dans un domaine révolutionnaire : rendre la biologie programmable.
Bien que la société ait un an, elle réalise déjà des avancées majeures. Aujourd'hui, elle a dévoilé ESM3, un modèle de langage génératif multimodal capable de répondre à des demandes et de concevoir de nouvelles protéines. Dans des tests, ESM3 a réussi à générer une nouvelle protéine fluorescente verte (esmGFP), une réalisation qui nécessiterait habituellement des centaines de millions d'années d'évolution.
Révolution du Design Protéique
La protéine esmGFP générée présente une séquence seulement 58 % similaire à celle de la protéine fluorescente la plus proche connue, l'entreprise estimant que cette innovation simule plus de 500 millions d'années de diversification naturelle des protéines.
Parallèlement au lancement d'ESM3, EvolutionaryScale a levé 142 millions de dollars lors d'un tour de financement d'amorçage dirigé par des investisseurs tels que Nat Friedman, Daniel Gross et Lux Capital. Le fonds de capital-risque d'Amazon et Nvidia a également contribué. Le modèle le plus petit a été publié en open source pour accélérer la recherche dans ce domaine novateur.
Le Défi à Venir
Créer ESM3 n'est que la première étape ; son impact dans le monde réel reste à explorer pleinement. EvolutionaryScale vise à utiliser la puissance des modèles d’IA générative pour décoder le langage fondamental de la vie, en se concentrant sur les molécules biologiques clés—ARN, protéines et ADN—ayant évolué sur 3,5 milliards d'années. En programmant la biologie et en concevant de nouvelles molécules, l'entreprise espère relever des défis majeurs tels que le changement climatique, la pollution plastique et les maladies, y compris le cancer.
Paysage Concurrentiel
De nombreuses organisations, y compris Google DeepMind et Isomorphic Labs, développent également des technologies similaires. Fondée en 2023, EvolutionaryScale a élaboré plusieurs modèles de langage protéique, culminant avec ESM3, qui se distingue par sa taille et ses capacités.
ESM3 a été entraîné sur un ensemble de données colossal—1 billion de teraflops de puissance de calcul à travers 2,78 milliards de protéines naturelles et 771 milliards de tokens uniques. Ce modèle avancé peut raisonner sur trois propriétés biologiques essentielles des protéines : séquence, structure et fonction. Les utilisateurs peuvent saisir des données partielles dans ces domaines, et ESM3 génère des prévisions pour toutes, créant ainsi des protéines novatrices.
Contrôle Accru pour les Scientifiques
« Le raisonnement multimodal d'ESM3 permet aux scientifiques de concevoir de nouvelles protéines avec un contrôle exceptionnel. Par exemple, il peut intégrer structure, séquence et fonction pour proposer des échafaudages pour des enzymes comme PETase, qui décompose les déchets plastiques », a déclaré la société.
Dans un cas, ESM3 a été utilisé pour concevoir une version novatrice d'une protéine fluorescente verte, permettant aux scientifiques de visualiser des protéines spécifiques au sein des cellules. Fait remarquable, la protéine générée est égale en luminosité à des variantes fluorescentes naturelles et aurait nécessité 500 millions d'années d'évolution pour se développer.
Un Modèle Adaptatif
Le modèle ESM3 présente également des capacités d'auto-amélioration, lui permettant de peaufiner ses résultats en fonction des retours d'expériences de laboratoire ou de données existantes.
Disponibilité et Applications Futures
Actuellement, ESM3 est disponible en trois tailles : petite, moyenne et grande. Le modèle le plus petit, avec 1,4 milliard de paramètres, est publié en open source sur GitHub sous une licence non commerciale, tandis que les versions moyenne et grande (jusqu'à 98 milliards de paramètres) sont accessibles pour un usage commercial via l'API d'EvolutionaryScale et ses partenariats avec Nvidia et AWS.
EvolutionaryScale aspire à ce que cette technologie réponde aux défis mondiaux et améliore la santé humaine. Ses applications les plus prometteuses pourraient se situer dans le secteur pharmaceutique, où les entreprises peuvent tirer parti d'ESM3 pour développer des traitements novateurs pour des conditions menaçant la vie. Les précédents modèles d'EvolutionaryScale ont déjà montré leur efficacité dans l'amélioration des caractéristiques des anticorps et la détection des variants de COVID-19, soulignant l'impact potentiel de cette IA révolutionnaire dans le domaine de la biologie.