Grok-2の発表:xAIの次世代AIチャットボット
2023年8月14日、エロン・マスクのAIスタートアップxAIは、新世代チャットボット「Grok-2」を公式に発表しました。Grok-2は、OpenAI、Google、Anthropicの製品に匹敵するとされています。Grok-2Siriーズには、強化された推論能力を持つ主力モデル「Grok-2」と、迅速な応答を必要とするアプリケーション向けに設計された軽量版「Grok-2 mini」が含まれています。
Grok-2の理解能力
「GPT-4レベル」の大規模モデルとされるGrok-2は、推論、プログラミング、会話能力に優れ、xAIの内部テストでも優れた成果を示しています。Grok-2 miniは性能面でGrok-2に及ばないものの、迅速な応答が特徴です。xAIによると、Grok-2は複雑なタスクの処理、特に欠落情報の正確な特定と無関係な内容のフィルタリングに大きく進展しています。
ベンチマークテストでは、Grok-2が優れた結果を達成しました。xAIのデータによれば、Grok-2はLMSYSリーダーボードでGPT-4 TurboやClaude 3 Opusを上回り、いくつかのテストではGPT-4oやLlama 3-405Bにも匹敵しました。しかし、このパフォーマンスには疑念もあり、アナリストはxAIのGPT-4oとの比較のタイミングに潜む違和感について言及し、結果が誇張されている可能性を示唆しています。
Grok-2の市場ポジション
独立した評価では、Grok-2はGoogleのGeminiやOpenAIのChatGPTに次ぐ、AIチャットボットのトップ5にランクインしました。ウォートンスクールのAI専門家イーサン・モリック氏は、「現在、GPT-4レベルのAIモデルは五つ存在する。GPT-4o、Claude 3.5、Gemini 1.5、Llama 3.1、そしてGrok-2だ」と述べ、これらのモデルすべてが大きな改善の可能性を秘めているものの、まだGPT-4を超えているものはないと強調しました。
xAIはGrok-2を、さまざまなタスクにおいてより直感的で制御可能かつ柔軟な結果を提供できる大きな進歩と位置づけています。LMSYSの評価によれば、Grok-2はMetaやAnthropicの最良モデルを上回っており、さらにユーザーの指示に従い、正確な情報を提供するシステムの確立にも力を入れています。これは、前モデルのGrok-1.5が「AIの幻想」に対する批判を受けたことを踏まえたものです。
画像生成の革新
Grok-2の注目すべき機能の一つは、最近人気のFLUX.1モデルを基にした直接画像生成能力です。この機能により、Grok-2のソーシャルプラットフォームでの応用が拡大し、ユーザーの創造性が大いに高まります。マスク氏はこの能力を強調し、プレミアム・プレミアム+ユーザー向けに徐々に提供される予定であることを説明しました。ただし、制限もあり、プレミアムユーザーは月に約20〜30枚、プレミアム+ユーザーはより多くの生成が可能ですが、この制限がユーザーの創造性に影響を与えるとの懸念も存在します。
今後の展望
Grok-2の発表とともに、マスク氏は年末までにGrok-3を開発する計画があると明らかにしました。Grok-3は、10万のNvidia H100チップを利用した大規模なアップグレードが予定されており、「すべてのメトリクスで世界最強のAIモデルを作成する」という目標を掲げています。この成功により、Grok-3の発表はxAIの競争力を強化する可能性があります。しかし、OpenAIやGoogleといった確立した大手に対抗するためには、xAIは技術と製品実装のさらなる突破口を必要としています。