A medida que avanza el potencial de GPT-4o, EvolutionaryScale, un laboratorio de investigación en inteligencia artificial fundado por exingenieros de Meta del ahora disuelto equipo de plegado de proteínas, se aventura en un área innovadora: hacer que la biología sea programable. A pesar de tener solo un año, la empresa ya está logrando avances significativos. Hoy presentó ESM3, un modelo de lenguaje generativo multimodal capaz de seguir indicaciones y diseñar nuevas proteínas. En pruebas, ESM3 generó con éxito una nueva proteína fluorescente verde (esmGFP), un logro que típicamente requeriría cientos de millones de años de evolución.
Revolucionando el Diseño de Proteínas
La esmGFP generada muestra una secuencia que solo es un 58% similar a la proteína fluorescente más cercana conocida, con la empresa estimando que esta innovación simula más de 500 millones de años de diversificación natural de proteínas. Junto con el lanzamiento de ESM3, EvolutionaryScale ha recaudado 142 millones de dólares en una ronda de financiamiento inicial liderada por inversores destacados como Nat Friedman, Daniel Gross y Lux Capital. La rama de capital de riesgo de Amazon y Nvidia también contribuyó. El modelo más pequeño ha sido de código abierto para acelerar la investigación en este campo pionero.
El Desafío por Delante
Crear ESM3 es solo el primer paso; su impacto en el mundo real aún debe explorarse completamente. EvolutionaryScale busca aprovechar el poder de los modelos de IA generativa para descifrar el lenguaje fundamental de la vida, enfocándose en las moléculas biológicas esenciales: ARN, proteínas y ADN, que han evolucionado durante 3.5 mil millones de años. Al programar la biología y diseñar nuevas moléculas, la empresa espera abordar desafíos significativos como el cambio climático, la contaminación por plásticos y enfermedades, incluido el cáncer.
Paisaje Competitivo
Numerosas organizaciones, incluidas Google DeepMind e Isomorphic Labs, también están desarrollando tecnologías similares. Fundada en 2023, EvolutionaryScale ha desarrollado varios modelos de lenguaje de proteínas, culminando en ESM3, que se destaca por su tamaño y capacidades. ESM3 ha sido entrenado en un enorme conjunto de datos: 1 billón de teraflops de poder computacional a partir de 2.78 mil millones de proteínas naturales y 771 mil millones de tokens únicos. Este modelo avanzado puede razonar sobre tres propiedades biológicas esenciales de las proteínas: secuencia, estructura y función. Los usuarios pueden introducir datos parciales en estas áreas, y ESM3 genera predicciones para todas, creando finalmente proteínas novedosas.
Control Mejorado para Científicos
“El razonamiento multimodal de ESM3 permite a los científicos generar nuevas proteínas con un control excepcional. Por ejemplo, puede integrar estructura, secuencia y función para proponer andamios para enzimas como PETase, que descompone residuos plásticos,” declaró la empresa. En un caso, ESM3 se utilizó para diseñar una versión innovadora de una proteína fluorescente verde, permitiendo a los científicos visualizar proteínas específicas dentro de las células. Notablemente, la proteína generada iguala el brillo de las variantes fluorescentes naturales y habría tomado 500 millones de años de evolución desarrollarla.
Un Modelo Adaptativo
El modelo ESM3 también presenta capacidades de auto-mejora, lo que le permite perfeccionar sus resultados basándose en retroalimentación de experimentos de laboratorio o datos existentes.
Disponibilidad y Aplicaciones Futuras
Actualmente, ESM3 está disponible en tres tamaños: pequeño, mediano y grande. El modelo más pequeño, con 1.4 mil millones de parámetros, está disponible como código abierto en GitHub bajo una licencia no comercial, mientras que las versiones mediana y grande (de hasta 98 mil millones de parámetros) están accesibles para uso comercial a través de la API de EvolutionaryScale y asociaciones con Nvidia y AWS. EvolutionaryScale busca que esta tecnología aborde desafíos globales y mejore la salud humana. Sus aplicaciones más prometedoras pueden estar en el sector farmacéutico, donde las empresas pueden aprovechar ESM3 para desarrollar tratamientos innovadores para condiciones que amenazan la vida. Modelos anteriores de EvolutionaryScale ya han demostrado éxito en la mejora de características de anticuerpos y en la detección de variantes de COVID-19, subrayando el impacto potencial de esta innovadora IA en la biología.