今日、AIの発展において重要な瞬間が訪れました。Meta Platformsが新たに発表した大規模言語モデル(LLM)「Llama 3」の登場です。MetaはFacebook、Instagram、WhatsApp、Oculus VRの親会社として知られています。この新モデルは、オープンソースのAIシステムとして非常に強力であると評価されており、MicrosoftのAzureクラウドサービスでの早期情報漏洩の直後に登場しました。
Llama 3の最初のラインアップには、80億パラメータモデルと700億パラメータモデルの2つのバリエーションが含まれています。これらは人工ニューロン間の接続の複雑さを示しています。また、Metaは400億パラメータモデルの訓練も進めていますが、リリース日については未発表です。Metaの製品担当VP、ラガヴァン・スリニヴァさんによれば、これらのモデルの性能は優れたものであり、主要な競合と比較しても卓越したベンチマーク能力を示しているとのことです。
現在、Llama 3の80Bおよび700Bモデルは、GoogleのGemini Pro 1.5、AnthropicのClaude 3、Mistralの7B Instructなどの競合モデルを多くのタスクで上回っています。特に、Llama 3は選択問題やコーディングタスクにおいて優れたパフォーマンスを発揮しますが、数学の言葉問題や大学院レベルのクイズでは弱点も見られます。とはいえ、80Bバージョンは小学校の数学問題では他のモデルを一貫して上回っています。
MetaのLlama 3は、単なるベンチマークでの成功にとどまらず、新たなスタンドアロン型のMeta AIチャットボットの基盤でもあります。このチャットボットは、OpenAIのChatGPT、AnthropicのClaude 3、HuggingFaceのHuggingChatと直接競合しています。マーク・ザッカーバーグ氏は「Meta AIは、自由に使える最も賢いAIアシスタントです」と述べています。
Meta AIチャットボットは、ユーザーフレンドリーな対話インターフェースを提供し、Facebookログインなしでアクセスできるものの、機能は初期段階では制限されることがあります。また、ユーザーからのプロンプトに基づいてほぼリアルタイムで画像を生成するMeta Imagineという統合画像生成モデルを含んでいます。この機能を利用するにはFacebookアカウントでのログインが必要です。
他のプラットフォームと異なり、Meta Imagineでは生成された画像のアスペクト比調整機能は現時点ではありませんが、AI生成を示す水印が付与されます。ユーザーは画像作成プロセスをライブで観覧し、アニメーションやGIFとして再生することができます。
Meta AIは、MicrosoftのBingおよびGoogleの検索結果からライブ情報を取得し、最新の応答を提供する能力を向上させています。とはいえ、現在のLlama 3はマルチモーダル機能を欠いており、ユーザーが画像や文書をアップロードして分析することはできませんが、Metaは将来的なアップデートでこれに対応する計画です。
Llama 3のオープンソースの特徴は、Llama 2と同様にMeta独自のライセンスのもとで運営されることです。第三者企業は商業目的でLlamaを使用できますが、700万人以上の月間アクティブユーザーを持つ場合は、Metaからライセンスを取得する必要があります。これによりオープンソースコミュニティから批判の声が上がっています。
Llama 3は、Llama 2と比較して誤拒否率が低下し、一貫性が高まり、応答の多様性が向上しています。これらの改善は、訓練プロセスの効率を三倍にする三段階の並列化戦略を利用した結果です。Llama 3は、150兆トークン以上のデータで訓練されており、これはLlama 2の七倍の量です。
700Bバージョンには8,000トークンのコンテキストウィンドウが搭載されており、これは前モデルのほぼ二倍の長さです。これにより、より長いプロンプトや包括的な情報の入力が可能になります。Llama 3は現在、MetaのAIウェブサイトからダウンロード可能であり、AWS、Google Cloud、Microsoft Azureなどのプラットフォームでもホスティングされています。
Llama 3についての詳細は、Metaの公式AIウェブサイトをご覧ください。