Meta铝合金推出突破性AI生物模型,模拟5亿年进化历史

随着GPT-4o技术的进步,EvolutionaryScale,一家由前Meta蛋白折叠团队工程师创立的人工智能研究实验室,正在探索一个开创性的领域:让生物学可编程化。尽管成立仅一年,该公司已取得显著进展。今天,它发布了ESM3,这是一种多模态生成语言模型,能够根据提示设计新型蛋白质。在测试中,ESM3成功生成了一种新型绿色荧光蛋白(esmGFP),这一成果通常需要数亿年的进化才能实现。

改革蛋白质设计

生成的esmGFP序列与已知荧光蛋白的相似度仅为58%。该公司估计,这项创新模拟了超过5亿年的自然蛋白质多样化进程。与ESM3的发布同时,EvolutionaryScale完成了一轮1.42亿美元的种子融资,主要投资者包括Nat Friedman、Daniel Gross和Lux Capital等。亚马逊和英伟达的风险投资部门也参与了投资。最小模型已开源,以推动该前沿领域的研究。

面临的挑战

创建ESM3仅是第一步;其在现实世界中的影响尚待全面探索。EvolutionaryScale力图利用生成性人工智能模型解码生命的基本语言,重点研究RNA、蛋白质和DNA等经历了35亿年进化的核心生物分子。通过编程生物学和设计新分子,公司希望应对气候变化、塑料污染及癌症等重大挑战。

竞争格局

包括谷歌DeepMind和Isomorphic Labs等多个组织也在开发类似技术。成立于2023年的EvolutionaryScale已开发出多种蛋白质语言模型,最终推出的ESM3以其规模和功能而脱颖而出。ESM3在一个庞大的数据集上进行了训练,利用了1万亿teraflops的计算能力,涵盖了27.8亿种天然蛋白质和7710亿个独特的token。该先进模型能够对蛋白质的三个基本生物属性进行推理:序列、结构和功能。用户可以输入这些轨道上的部分数据,ESM3将生成所有的预测,最终创造出新型蛋白质。

增强科学家的控制能力

“ESM3的多模态推理能力使科学家能够以卓越的控制水平设计新蛋白。例如,它能够整合结构、序列和功能,提出用于降解塑料废物的酶PETase的框架,”公司指出。在一次实验中,ESM3被用来设计一种新型绿色荧光蛋白,使科学家能够在细胞内可视化特定蛋白质。值得注意的是,生成的蛋白质亮度与天然荧光变体相当,而其进化过程理论上需要5亿年。

自适应模型

ESM3模型还具有自我改善能力,能够根据实验反馈或现有数据优化其输出。

可用性及未来应用

目前,ESM3分为小型、中型和大型三个版本。最小模型包含14亿个参数,通过非商业许可证在GitHub上开源,而中型和大型版本(最多98亿参数)则通过EvolutionaryScale的API及与英伟达和AWS的合作,供商业使用。EvolutionaryScale旨在利用这项技术解决全球性挑战,提升人类健康。其最具潜力的应用可能在制药行业,企业能够利用ESM3开发对抗危及生命的创新疗法。EvolutionaryScale的前几个模型已经成功提升了抗体特性,并检测COVID-19变种,彰显了这一突破性人工智能在生物学领域的潜在影响。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles