今週開催されたGoogle I/Oデベロッパーカンファレンスで、Googleは最新の人工知能モデル「Gemini 1.5 Flash」を発表しました。このモデルは、スピードと効率性に最適化されており、軽量でコスト効果の高い強力なAIツールを求める開発者のニーズに応える形で、AIの限界を押し広げています。
Google DeepMindのCEO、デミス・ハサビス氏は、Gemini 1.5 Flashが要約、チャット機能、画像や動画のキャプション付け、長文のドキュメントやスプレッドシートからのデータ抽出など、さまざまなアプリケーションで優れたパフォーマンスを発揮すると強調しました。この新しいモデルは、Gemini 1.5 Proからの重要な知識やスキルを凝縮する「蒸留」プロセスを活用しており、軽量設計と堅牢な機能のバランスを実現しています。
Gemini 1.5 Flashは、コンパクトなサイズにもかかわらず、Pro版と同様のマルチモーダル機能を備えており、最大100万トークンの長文コンテキストウィンドウを持っています。これにより、最大1,500ページのドキュメントや30,000行以上のコードを一度で分析することができ、開発者にとって前例のない便利さを提供します。
Gemini 1.5 Flashは、開発者がAI製品やサービスをより迅速かつ経済的に構築できるように設計されています。また、GoogleはGemini 1.5 Proの機能向上を図り、コーディング、推論、視聴覚分析における能力を強化しました。さらに、今年後半にはコンテキストウィンドウを200万トークンに倍増させる計画があり、これにより2時間の動画、22時間の音声、60,000行以上のコード、あるいは140万語以上のコンテンツを同時に処理できるようになります。
現在、Gemini 1.5 FlashとProの両バージョンはGoogle AI StudioとVertex AIでプレビュー可能です。また、Googleは新しいオープンモデル「Gemma 2」をリリースしました。これらのアップデートは主にAIアプリケーションの構築に関心のある開発者やユーザーを対象としており、一般消費者が直接恩恵を受ける可能性は低いです。
Gemini 1.5 Flashの発表は、AI分野におけるGoogleの革新力を再確認させるものであり、開発者に未来のAI製品やサービスを進展させるための強力で柔軟なツールを提供します。