2023年：オープンソース言語モデル（LLM）の革新と進展

Home AIニュース 2023年：オープンソース言語モデル（LLM）の革新と進展

2022年末に登場したChatGPTは、AI企業やテクノロジー大手の間で競争を引き起こし、急成長する大規模言語モデル（LLM）の市場をリードしようとする動きが加速しました。この激しい競争を受けて、多くの企業が自社の言語モデルを独自サービスとして提供し、APIアクセスを提供しながら、基盤となるモデルの重みやトレーニングデータセット、手法の詳細を隠しました。

一方で、2023年にはオープンソースLLMエコシステムが大きく成長し、特定のアプリケーションにカスタマイズ可能なダウンロード可能なモデルのリリースが相次ぎました。この展開により、オープンソースはLLMの重要なプレイヤーとして地位を確立し、独自ソリューションと同等に競争しています。

大きさは性能に影響するのか？

2023年以前、大規模言語モデルのサイズを増やすことが性能向上に不可欠だと広く信じられていました。BLOOMやOPTのようなオープンソースモデルは、1750億パラメータを持つOpenAIのGPT-3に匹敵するアプローチを示していましたが、これらの大規模モデルは効果的に運用するために膨大な計算資源と専門知識を要しました。

このパラダイムは、2023年2月にMetaが7〜65億パラメータを持つLlamaSiriーズを発表したことで大きく変わりました。Llamaは、小型モデルが大型モデルと同等の性能を発揮できることを証明し、モデルのサイズが効果の唯一の決定因子ではないことを支持しました。Llamaの成功の鍵は、大規模なデータセットでのトレーニングにあり、GPT-3が約3000億トークンを使用したのに対し、Llamaは最大1.4兆トークンを取り込み、小型モデルをより広範なデータセットでトレーニングすることで強力なアプローチを実現しました。

オープンソースモデルの利点

Llamaの人気の理由は、大きく二つの利点にあります。一つは、単一のGPUで動作できること、もう一つは、オープンソースとしてリリースされたことです。このアクセスの良さにより、研究コミュニティは迅速にそのアーキテクチャや成果を基に発展し、CerebrasのCerebras-GPT、EleutherAIのPythia、MosaicMLのMPT、SalesforceのX-GEN、TIIUAEのFalconなど、多くの注目すべきオープンソースLLMが登場しました。

2023年7月、MetaはLlama 2をリリースし、多くの派生モデルの基盤となりました。また、Mistral.AIも、そのモデルMistralとMixtralの導入で注目を集め、性能とコスト効率の面で高く評価されました。

「オリジナルのLlamaのリリース以来、オープンソースLLMの分野は加速しており、MixtralはGPT-4やClaudeに次いで人間評価で3番目に有用なモデルとして認識されています」と、Hugging Faceのプロダクト＆グロース責任者Jeff Boudierは述べています。

Alpaca、Vicuna、Dolly、Koalaなどの追加モデルもこれらの基盤モデルを用いて特定のアプリケーション向けに開発され、Hugging Faceのデータによれば、開発者は数千のフォークや専門バージョンを作成しています。特に「Llama」で14,500件、「Mistral」で3,500件、「Falcon」で2,400件以上の結果が存在します。Mixtralは2023年12月のリリースにもかかわらず、すでに150のプロジェクトの基盤として機能しています。

これらのモデルのオープンソース性は、開発者が新たなモデルを作成したり、既存のモデルと組み合わせてさまざまな構成を試みることを可能にし、LLMの実用性を高めています。

オープンソースモデルの未来

独自モデルが進化を続ける中で、オープンソースコミュニティは依然として強力な競争相手です。テクノロジー大手は、オープンソースモデルの価値を認識し、自社製品に取り入れる動きを強めています。OpenAIの主要な支援者であるMicrosoftは、オープンソースモデルのOrcaとPhi-2をリリースし、自社のAzure AI Studioプラットフォームとの統合を進めています。同様に、Amazonも独自モデルとオープンソースモデルの両方をホストするクラウドサービスBedrockを発表しました。

「2023年、企業は特にChatGPTの成功を受けて、LLMの能力に驚かされました」とBoudier氏は言います。「CEOたちは自チームに生成AIの利用ケースを定義するよう指示し、閉じたモデルのAPIを使った迅速な実験や概念実証アプリケーションの開発を促しました。」

しかし、重要なテクノロジーに外部APIに依存することには、重要なソースコードや顧客データの漏洩リスクなど、長期的に持続可能でない戦略が伴います。そのため、オープンソースエコシステムは、プライバシーとコンプライアンスのニーズに対応しつつ、生成AIを導入したい企業にとって有望な道を提供します。

「AIが技術開発を変革する中で、過去のイノベーションと同様に、組織はAIソリューションを社内で構築・管理する必要があります。その際、顧客情報のプライバシー、セキュリティ、規制遵守を確保することが求められます」とBoudier氏は結論づけています。「歴史的なトレンドから見て、これはオープンソースの采配を意味するでしょう。」

Pika LabsのテキストからビデオへAIを活用する方法：始め方完全ガイド

2024年に期待する5つのAI革新

Most people like

Vital

114.5K

AI技術による患者ケアの革新

ケアアドバイザー Healthcare

restorePhotos.io

250.3K

私たちの革新的なプラットフォームで、大切な思い出を蘇らせましょう。先進的なAI技術を駆使して、古くてぼやけた写真を高画質に改善します。色あせた顔の画像を鮮明で生き生きとした記念品に変えて、大切な瞬間を何年にもわたって保存できます。

写真修復 AI Background Remover

Predis.ai

1.2M

Predis.aiは、ソーシャルメディア向けに設計された高度なAIマーケティングツールで、コンテンツ制作と洞察に満ちた分析を得意としています。オンラインプレゼンスの向上やマーケティング戦略の効率化を目指す方に、Predis.aiは効果的なオーディエンスとのエンゲージメントを実現します。

AIマーケティングツール AI Social Media Assistant

IndexBox

200.6K

私たちのAI駆動のマーケットインテリジェンスプラットフォームをご紹介します。このプラットフォームは、企業が実用的な洞察とデータに基づいた戦略を持てるよう設計されています。この革新的なツールは、先進的な分析と人工知能を駆使して、市場動向、消費者行動、競争環境について包括的な理解を提供します。経験豊富な起業家でも成長中のスタートアップでも、私たちのプラットフォームは、情報に基づいた意思決定を行い、今日のダイナミックな市場で成功を収めるために必要なリソースを提供します。最先端のソリューションでビジネスインテリジェンスの未来を体験してください。

市場インテリジェンス Other

Find AI tools in YBX