Google、Gemini1.5フラッシュを発表：革新的な1Mコンテキストウィンドウを搭載した高速マルチモーダルモデル

Home AIニュース Google、Gemini1.5フラッシュを発表：革新的な1Mコンテキストウィンドウを搭載した高速マルチモーダルモデル

Googleは、スケーラビリティと高頻度タスク向けに設計されたコンパクトなマルチモーダルモデル「Gemini 1.5 Flash」を発表しました。このモデルは100万トークンのコンテキストウィンドウを備えており、Google AI StudioのGemini APIを通じて一般公開されています。また、今年2月に導入された「Gemini 1.5 Pro」は、コンテキストウィンドウが100万から200万トークンに拡張されるなどの大規模アップグレードを予定しています。興味のある開発者は、このアップデートにアクセスするために待機リストに登録する必要があります。

Gemini 1.5の新機能

Gemini 1.5 FlashとGemini 1.5 Proは、それぞれ異なるニーズに応えています。Gemini 1.5 Flashは出力速度を優先し、迅速な応答が必要なタスクに最適です。一方、Gemini 1.5 Proは複雑で多段階の推論タスクに最適化されており、Googleの大型モデル「1.0 Ultra」と同様のパフォーマンスを発揮します。Google Labsの副社長であるジョシュ・ウッドワードによれば、迅速な応答が求められるタスクにはGemini 1.5 Flashを、複雑なアプリケーションにはGemini 1.5 Proを推奨しています。

この階層的アプローチにより、開発者は目的に応じて複数のAIモデルを選択できるようになり、画一的な戦略を脱却しています。さまざまな機能を提供することで、GoogleはAI駆動のサービスにおけるユーザー体験を向上させています。ただし、Gemini 1.5 Flashは大規模データセットで十分に訓練されていないため、一部の開発者には制約があるかもしれません。その場合、Gemini 1.5 Proにアップグレードすることが有益です。

Geminiモデルラインナップには、軽量モデルのGemmaやGemma 2から、Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro、Gemini 1.0 Ultraまで多様な選択肢があります。ウッドワードは「開発者はユースケースに応じてこれらのサイズを切り替えることができる」と述べており、マルチモーダル入力機能と一貫したバックエンド体験を維持しています。

この発表は、OpenAIがユーザー向けのデスクトップアプリを含むマルチモーダル大型言語モデル（LLM）「GPT-4o」を発表した直後に行われました。

Gemini 1.5の両モデルは、欧州経済領域、英国、スイスを含む200以上の国と地域で一般公開されています。

更新情報（5月14日12:06 PM PT）

200万トークンのコンテキストウィンドウのアップグレードは、Gemini 1.5 Proのみに適用され、Gemini 1.5 Flashには適用されません。

OpenAIがGPT-4oを無料提供：ChatGPT Plusは今でも必要か？

ミッドリアル、Gen AI「自分だけの冒険を選ぼう」プラットフォームを発表：インタラクティブなストーリーテリングを体験しよう