Elon Muskが競争の激しい人工知能(AI)の世界に新たに参入しました。その名も「Grok」。これは、ChatGPTやMidjourneyに対抗する会話型AIで、ユーモアを交えた応答を目指しており、コンテンツの制限が少なく、率直なトーンが特徴です。マスク自身がユーモアを交えて指摘したように、Grokはユーザーに新しいチャットボット体験を提供します。ここでは、Grokについて知っておくべきポイントを紹介します。
Grokとは?
Grokは、マスクが設立したAIスタートアップxAIによって開発された生成型AIチャットボットです。初期にはGrok-1モデルを利用しており、「数万」のGPUを使用して数ヶ月かけて作成され、画像生成にはBlack Forest LabsのFlux.1モデルが活用されています。Grokは多様なウェブデータ(2023年第3四半期までの情報)とXのユーザーデータでトレーニングされています。現在、Grokは2024年8月に発表されたGrok-2モデルで運用されています。2023年11月には、月額16ドルで利用できるX Premium+のプレミアムオファリングとして最初に登場しました。2024年3月には月額8ドルのプレミアムプランに利用が拡大しましたが、無料のXユーザーはまだ利用できません。「Grok」という名前は、ロバート・ハインラインのSF小説「異星の客」に由来し、直感的に理解する力やラポールを構築する能力を意味します。
Grokの成り立ち
Elon Muskは、2015年にSam Altmanらと共にOpenAIを設立しましたが、2018年に組織の方向性に対する意見の相違から離脱しました。2022年11月のChatGPTの発表後、マスクはそのアプローチに懸念を示し、2023年4月にタッカー・カールソンショーで「社会的規範に縛られない真実探求AI」を作る計画を発表しました。当初は「TruthGPT」と名付けられましたが、後にGrokに改名されました。
2024年3月、Grok-1はGrok-1.5にアップグレードされ、その性能を向上させ、コンテキストの長さを128,000トークンに拡張しました。同年4月には、Grok AIがXの「Explore」セクションに統合され、速報ニュースを要約する役割を担うようになりました。しかし、イランとイスラエルに関する誤った見出しを報道したことで論争が巻き起こり、AIの誤りに対する脆弱性が浮き彫りになりました。その後、Grok-1.5はGrok-2モデルに移行し、Grok-2 miniと共に2024年8月にリリースされました。
Grokの機能
Grokは、様々な質問に対応できる構造を持ち、公開ソースの大規模言語モデルであり、3140億のパラメータを特徴としています。これはLlama 3.1-405Bの約4分の3の規模です。2023年7月、XはトレーニングのためにxAIがデータを収集できるようにユーザー設定を変更し、プライバシー擁護者から反発を受けてすぐに撤回しました。このため、9カ国のEUがGDPR違反の可能性で訴訟を起こしました。Grokは、2023年第3四半期までの知識を元にユーザーの質問に答えることができ、以降の出来事についてはXからリアルタイムの情報を検索することが可能です。このため、Grokは競合のChatGPTに比べて幻覚を生じやすく、誤情報を広める傾向があります。
Grokの大きな特徴は、政治や宗教、人種といったタブーなテーマについてもオープンに議論できることです。たとえば、Xの従業員がクリスマス音楽を聴く際の楽しみ方について尋ねたところ、Grokは「好きな時にいつでも」と答え、反対者には「自分のことを気にしろ」とアドバイスしました。
さらに、Grok-2とGrok-2 miniのリリースに伴い、画像生成機能が新たに追加され、ほとんど制約がありません。このGrok 2.0は、特定の制限を持っていると主張していますが、ユーザーはセレブリティや政治家、著作権のあるキャラクター(例:ディズニーのミッキーマウスや任天堂のマリオ)の画像を生成することができます。
ディズニーや任天堂のような厳しい知的財産保護がある企業によって、Grokの画像生成機能には今後、訴訟や大幅な変更が生じる可能性があります。