Meta Alum Lança Modelo Revolucionário de Biologia com IA Simulando 500 Milhões de Anos de Evolução

À medida que o potencial do GPT-4o avança, a EvolutionaryScale, um laboratório de pesquisa em IA fundado por ex-engenheiros da Meta da extinta equipe de dobramento de proteínas, está explorando uma área inovadora: a programabilidade da biologia. Com apenas um ano de existência, a empresa já está fazendo avanços significativos. Hoje, lançou o ESM3, um modelo de linguagem generativa multimodal capaz de seguir comandos e projetar novas proteínas. Em testes, o ESM3 gerou com sucesso uma nova proteína fluorescente verde (esmGFP), um feito que normalmente exigiria centenas de milhões de anos de evolução.

Revolucionando o Design de Proteínas

A esmGFP gerada possui uma sequência apenas 58% semelhante à proteína fluorescente mais próxima conhecida, com a empresa estimando que essa inovação simula mais de 500 milhões de anos de diversificação natural de proteínas.

Junto ao lançamento do ESM3, a EvolutionaryScale arrecadou US$ 142 milhões em uma rodada de financiamento semente, liderada por investidores notáveis como Nat Friedman, Daniel Gross e Lux Capital. O braço de capital de risco da Amazon e da Nvidia também contribuiu. O modelo menor foi disponibilizado como código aberto para acelerar a pesquisa neste campo pioneiro.

O Desafio à Frente

Criar o ESM3 é apenas o primeiro passo; seu impacto no mundo real ainda precisa ser completamente explorado. A EvolutionaryScale busca aproveitar o poder dos modelos de IA generativa para decifrar a linguagem fundamental da vida, focando em moléculas biológicas essenciais—RNA, proteínas e DNA—que evoluíram ao longo de 3,5 bilhões de anos. Ao programar biologia e projetar novas moléculas, a empresa espera enfrentar desafios significativos, como mudanças climáticas, poluição plástica e doenças, incluindo o câncer.

Cenário Competitivo

Várias organizações, incluindo Google DeepMind e Isomorphic Labs, também estão desenvolvendo tecnologias similares. Fundada em 2023, a EvolutionaryScale desenvolveu diversos modelos de linguagem de proteínas, culminando no ESM3, que se destaca por seu tamanho e capacidades.

O ESM3 foi treinado em um colossal conjunto de dados—1 trilhão de teraflops de poder computacional distribuídos entre 2,78 bilhões de proteínas naturais e 771 bilhões de tokens únicos. Este modelo avançado pode raciocinar sobre três propriedades biológicas essenciais das proteínas: sequência, estrutura e função. Os usuários podem inserir dados parciais nessas áreas, e o ESM3 gera previsões para todas, criando, assim, proteínas novas.

Controle Aprimorado para Cientistas

“O raciocínio multimodal do ESM3 capacita os cientistas a projetar novas proteínas com controle excepcional. Por exemplo, ele pode integrar estrutura, sequência e função para propor suportes para enzimas como a PETase, que degrada resíduos plásticos,” afirmou a empresa. Em um caso, o ESM3 foi utilizado para projetar uma nova versão de uma proteína fluorescente verde, permitindo que os cientistas visualizassem proteínas específicas dentro das células. Notavelmente, a proteína gerada iguala o brilho das variantes fluorescentes naturais e levaria 500 milhões de anos para evoluir.

Um Modelo Adaptativo

O modelo ESM3 também possui capacidades de autoaperfeiçoamento, permitindo que ele refine suas saídas com base no feedback de experimentos laboratoriais ou dados existentes.

Disponibilidade e Aplicações Futuras

Atualmente, o ESM3 está disponível em três tamanhos: pequeno, médio e grande. O modelo menor, com 1,4 bilhão de parâmetros, é de código aberto no GitHub sob uma licença não comercial, enquanto as versões média e grande (até 98 bilhões de parâmetros) estão acessíveis para uso comercial através da API da EvolutionaryScale e parcerias com a Nvidia e a AWS.

A EvolutionaryScale tem como objetivo que essa tecnologia aborde desafios globais e melhore a saúde humana. Suas aplicações mais promissoras podem estar no setor farmacêutico, onde as empresas podem usar o ESM3 para desenvolver tratamentos inovadores para condições potencialmente letais. Modelos anteriores da EvolutionaryScale já demonstraram sucesso em melhorar características de anticorpos e detectar variantes do COVID-19, destacando o impacto potencial dessa IA revolucionária na biologia.

Most people like

Find AI tools in YBX