進化するGPT-4oの可能性に伴い、元Metaのプロテインフォールディングチームに所属していたエンジニアたちが設立したAI研究所「EvolutionaryScale」は、生物をプログラム可能にするという画期的な分野に挑戦しています。設立から1年の会社はすでに重要な進展を遂げており、本日、ESM3というマルチモーダル生成言語モデルを発表しました。このモデルは、プロンプトに従い、新しいタンパク質の設計を行う能力を持っています。テストでは、ESM3が新しい緑色蛍光タンパク質(esmGFP)を生成し、これは通常、数億年の進化を必要とする成果です。
タンパク質設計の革新
生成されたesmGFPは、最も近い既知の蛍光タンパク質に対して58%しか類似しておらず、EvolutionaryScaleはこの革新が5億年以上の自然なタンパク質の多様化をシミュレートしていると考えています。ESM3の発表に伴い、EvolutionaryScaleは、Nat Friedman、Daniel Gross、Lux Capitalなどの著名な投資家から1億4200万ドルのシード資金を調達しました。AmazonやNvidiaのベンチャーキャピタルも資金提供に参加しました。最小モデルは、先駆的な研究を促進するためにオープンソースとして公開されています。
前方の課題
ESM3の開発は第一歩に過ぎず、現実の影響はまだ十分に探求されていません。EvolutionaryScaleは、生成AIモデルの力を活用して、35億年の進化を経たRNA、タンパク質、DNAなどの生物学的基本分子の言語を解読することを目指しています。生物をプログラムし新しい分子を設計することで、気候変動、プラスチック汚染、癌などの重要な課題に取り組むことを期待しています。
競争の状況
Google DeepMindやIsomorphic Labsなど、多くの組織も類似の技術を開発しています。2023年に設立されたEvolutionaryScaleは、ESM3に至るまでに複数のタンパク質言語モデルを開発しており、その独自の規模と能力で際立っています。ESM3は、2.78億の自然タンパク質と7710億のユニークトークンを用いて、1兆テラフロップスの計算パワーでトレーニングされました。このモデルは、タンパク質の3つの基本的な生物学的特性(配列、構造、機能)について推論できます。ユーザーは、これらのトラックにわたる部分データを入力し、ESM3が全ての予測を生成し、最終的に新しいタンパク質を創出します。
科学者への強化された制御
「ESM3のマルチモーダル推論により、科学者は新しいタンパク質を卓越した制御で設計できます。例えば、PETaseのような酵素のスカフォールドを提案するために構造、配列、機能を統合できます」と同社は述べています。実際の例として、ESM3を用いて新しいバージョンの緑色蛍光タンパク質が設計され、科学者は細胞内の特定のタンパク質を可視化できるようになりました。この生成されたタンパク質は、自然の蛍光バリアントと同等の明るさを持っており、進化に500万年かかるところを短期間で実現しました。
適応モデル
ESM3は自己改善機能を備え、実験や既存データからのフィードバックに基づいて出力を洗練できます。
利用可能性と将来の応用
現在、ESM3は小型、中型、大型の3サイズで利用可能です。最小モデル(14億パラメータ)は非営利ライセンスのもとGitHubでオープンソースとして公開されており、中型および大型バージョン(最大98億パラメータ)はEvolutionaryScaleのAPIやNvidia、AWSとの提携を通じて商業利用可能です。EvolutionaryScaleは、この技術をグローバルな課題に取り組み、人々の健康を向上させることを目指しています。最も有望な応用は製薬業界にあり、企業はESM3を利用して生命を脅かす病気に対する革新的な治療法を開発することが期待されています。EvolutionaryScaleの以前のモデルは、抗体特性の向上やCOVID-19変異株の検出において成功を収めており、これらの革新的なAIが生物学に与える影響の潜在力を強調しています。