Googleは、待望の次世代大規模言語モデル「Gemini」を公式に発表しました。このモデルは、同社がこれまでに開発した中で「最も大きく、最も力強い」ものとされています。長い間の憶測を経て、GoogleはGeminiの機能を詳細に説明したブログ記事を公開しました。Geminiは「Ultra」「Pro」「Nano」の3つのバリエーションがあり、モバイルデバイスでも大規模データセンターでも効果的に機能します。
本日から、GeminiはBardチャットボットなどのさまざまなソリューションに搭載されます。初めはGemini Proモデルが使用され、英語で利用可能です。Googleは、これによりBardの推論能力と理解力が大幅に向上すると主張しています。また、2024年初頭にはBard Advancedのリリースを予定していますが、詳細はまだ明らかではありません。とはいえ、「高度なモデルと機能」へのアクセスはGemini Ultraから始まるとされています。
新しいPixel 8 Proは、初めてGemini Nanoを搭載したスマートフォンとなります。来年には、Recorderアプリでの要約機能や、WhatsApp向けに初めて利用できるGboardのSmart Replyの開発者プレビューなど、エキサイティングな新機能が提供される予定です。Geminiは、Google Ads、Chrome、Duet AIにも統合され、多彩な製品ラインにわたってさらに多くの機能が追加される予定です。特に、GoogleはGeminiの検索パフォーマンスを改善しており、Search Generative Experience(SGE)への向上を見込んでいます。
ブログ記事ではMakersuiteとの統合に関する言及はありませんでしたが、以前のリークによれば、Googleのウェブ開発プラットフォームがGeminiの生成能力を活用することが示唆されています。Geminiは、CEOのSundar PichaiがI/O 2023イベントで初めて発表したもので、急速に進化するAIの分野において競争力を確立することを目指しています。
12月13日から、開発者や企業顧客はGemini APIを通じてGemini Proにアクセスできます。このAPIはVertex AIまたはGoogle AI Studio(Googleの無料ウェブベースの開発者ツール)で利用可能です。Gemini Ultraは、特定の組織には早期に提供され、2024年初頭には企業顧客向けにより広く利用可能になる予定です。Geminiを活用したアプリケーションを作成したいAndroid開発者は、Android AICoreを通じてNanoバリアントの早期プレビューにサインアップすることができます。
Geminiは、5月の企業イベントで初めて発表されましたが、その後はほとんど公にされていませんでした。この先進的なモデルは、大規模言語モデルの基盤となる技術革新を重視しており、最近のAIセーフティサミットでも主要な議題となりました。Googleは今週、非英語のクエリへの対応に課題があったため、モデルをプライベートイベントで披露する計画をキャンセルしましたが、いくつかのビジネスパートナーには内部でのプレゼンテーションが行われました。
Googleの上層部は、GeminiがOpenAIのChatGPTに匹敵することを強く望んでおり、競争力を維持するために早期リリースが急務であると考えています。また、MicrosoftのAI Copilotが生産性ソフトウェアで大きな進歩を遂げている中、Googleはそのイノベーションのペースを維持する意欲を示しています。
ハードウェアの進展として、GoogleはGeminiを自社開発のTPUチップでトレーニングしました。モデルの発表に合わせて、Cloud TPU v5pという新しいAIアクセラレーターも発表されました。この最新のチップは、大規模言語モデルのトレーニングで前のTPU v4世代と比べて2.8倍の速さを実現しており、すでに利用可能なCloud TPU v5eよりも強力です。
さらに、Google CloudはAIトレーニングと最適化を強化するために特別に設計されたAIハイパコンピュータを発表しました。この新しいインフラは、生成AIアプリケーションの増加する計算要求に応え、AIに特化したハードウェア、ソフトウェア、機械学習フレームワーク、消費モデルを統合したシステムを提供します。
Cloud TPU v5pや新しいAIハイパコンピュータを利用するには、企業は指定されたGoogle Cloudアカウントマネージャーと連携する必要があります。これにより、最新技術をビジネスニーズに活用できるようになります。