テニックスのAI革新:オープンソースのLlama 3モデルがGPT-4を超えたパフォーマンスを実現

独占インタビューで、AIスタートアップTenyxの創設者兼CEOであるイタマール・アレル氏が、自然言語処理の画期的な進展を明らかにしました。Tenyxは、Metaのオープンソース言語モデル「Llama-3」を「Tenyx-70B」として改良し、特定の分野でOpenAIのGPT-4を上回る性能を実現しました。これは、オープンソースモデルが独自の基準を超えた初めてのケースです。

「私たちは、基盤モデルを元のトレーニング以上に向上させるファインチューニング技術を開発しました」とアレル氏は説明しました。「私たちはこのアプローチを活用し、大規模モデルの冗長性を利用して継続的または段階的な学習を可能にすることに期待しています。」

TenyxのLlama-3モデルは、数学やコーディングにおいてGPT-4を上回り、基本のLlama-3モデルに比べてあらゆる機能で強化されています。この成果は、オープンソースAIの新しい時代を示しています。

「破滅的忘却」に取り組む

Tenyxは、「破滅的忘却」という問題に直面しています。これは、モデルが新しいデータに直面したときに以前習得した知識を失う現象です。Tenyxは、モデルのパラメーターの一部を選択的に更新することで、新しい情報に効果的にトレーニングしつつ、既存のスキルを保持しています。

「モデルのパラメーターのわずか5%を変更し、残りをそのままにしておくことで、他の機能を歪めることなく、より積極的にトレーニングできます」とアレル氏は指摘しました。この方法により、Tenyxは70億パラメーターを持つLlama-3モデルを100台のGPUを使用してわずか15時間でファインチューニングしています。

オープンソースAIへのコミットメント

TenyxはオープンソースAIを推進し、ファインチューニングされたモデルTenyx-70Bを元のLlama-3と同じライセンスの下で公開しています。「私たちはオープンソースモデルを信じています」とアレル氏は述べています。「コミュニティと進展を共有することは、革新を促進し、皆に利益をもたらします。」

Tenyxのトレーニング後の最適化技術は、特化型チャットボットの開発から、展開済みモデルの頻繁な更新を支援するなど、幅広い応用が可能です。

AIの風景を再構築する

Tenyxのブレークスルーは、企業や研究者が高性能な言語モデルを独自の解決策の高額なコストなしに利用できるようにし、大きな影響を与えます。この進歩は、他の開発者がTenyxの成功を基にさらなる革新を生むきっかけにもなりうるでしょう。

「これは、業界やOpenAIのような企業にとって何を意味するのか?」とアレル氏は考えます。AIセクターでの競争が激化する中、Tenyxによるオープンソースモデルのファインチューニングは、業界のダイナミクスや企業が自然言語処理にアプローチする方法を再定義する可能性があります。

Tenyxに最適化されたLlama-3モデルは、基盤モデルに見られる制約——偶発的な非論理的応答を含みますが、その改善点は注目に値します。アレル氏は、モデルが数学や推論において基盤モデルの85%に対し、ほぼ96%の精度を達成していると報告しています。

Tenyxが新たなオープンソースAIの革新の波を引き起こす中、AIエコシステムへの長期的な影響は依然として注目されます。しかし、Tenyxがオープンソースモデルが独自の競合を凌駕できることを証明したことは明白であり、人工知能のよりアクセス可能で協力的な未来への道を切り開いています。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles