Googleは、バージョン2.0のリリースを控え、GeminiSiriーズの強化を進めています。今日、同社は新たに2つのモデルを発表しました。ひとつは、Gemini 1.5の小型バリアントであるGemini 1.5 Flash-8B、もうひとつはGemini 1.5 FlashおよびGemini 1.5 Proのアップグレード版です。Googleによると、これらのモデルはさまざまな内部ベンチマークテストで顕著な改善が見られ、特に1.5 Flashは大幅な性能向上を、1.5 Proは数学、コーディング、複雑なプロンプト処理において強化された能力を示しています。
Google AI Studioのプロダクトリードであるローガン・キルパトリックは、「Gemini 1.5 Flashは、世界中の開発者にとって現在最良の選択肢です」とXに投稿しました。
Geminiモデルの最新の実験的バージョン
5月にリリースされたGemini 1.5 Flashは、長い文脈を管理できるよう設計されており、1000万トークン以上の詳細情報を分析できます。これにより、文書、ビデオ、音声などの高ボリュームなマルチモーダル入力を処理する能力が向上しました。
新たに登場した8億パラメータのGemini 1.5 Flashは、より良い体験を提供し、更新されたGemini 1.5 Proはコーディングや複雑なタスクの性能を強化しています。これは、8月に登場した前モデルのシンプルな置き換えです。
キルパトリックは、今後数週間以内に実用化版が期待され、その際に評価機能が含まれる可能性が高いとも述べています。これらの実験モデルは、開発者からのフィードバックを集め、迅速なアップデートを促進するうえで重要です。
最新のGemini 1.5 FlashおよびProは、100万トークンの制限があり、Google AI StudioやGemini APIを通じて無料でテストできる予定です。将来的にはVertex AIの実験的エンドポイントに追加する計画もあります。無料利用枠が提供され、近々の生産版も期待されています。
9月3日から、Googleは新モデルへのリクエストを自動的にリダイレクトし、混乱を避けるために古いバージョンを段階的に廃止します。
キルパトリックは、「このモデルが新しいマルチモーダル利用ケースをどのように実現できるか、皆さんの考えをお聞かせください」とXで述べています。
Gemini 1.5の前例のないスケール
Google DeepMindの研究者たちは、Gemini 1.5のスケールを現代の言語モデルの中で「前例のないもの」と表現しています。キルパトリックは、今月初めに公開された初の実験モデルに対するコミュニティの熱意に感謝の意を示し、これらの革新を実現するための努力を強調しました。
最近のアップデートに対する賛否
コミュニティからの初期フィードバックはさまざまで、積極的な称賛から懐疑的な意見まで寄せられています。Large Model Systems Organization(LMSO)の最新のリーダーボード更新では、Gemini 1.5 Flashが2万票を集めて23位から6位に飛躍し、Llamaなどのモデルと競争力を持ち、Googleの過去のオファーの一部を上回る結果となりました。
一部のユーザーは画像分析における「堅実な改善」を指摘する一方で、アップデートの頻度について疑問を呈し、Gemini 2.0のようにより実質的なバージョンを求める意見もありました。また、新しいリリースに対して「怠惰なコーディング病」に悩まされているとの指摘もあり、長文や一貫性の維持に苦労しているとの声が上がっています。
Googleのモデル名の選択に関しても、ユーザーからのおもしろおかしい意見が寄せられており、その創造性が問われています。Geminiモデルに関する議論は続き、AIの進歩とユーザーの期待の複雑さを反映しています。