最近、Googleが最新の人工知能モデル「Gemini 1.5」を発表し、情報処理能力において大きな進歩を遂げたことが明らかになりました。前モデルの「Gemini 1.0 Ultra」と比較して、Gemini 1.5は効率性と処理速度の著しい向上を実現しています。
アルファベットおよびGoogleのCEOであるサンダー・ピチャイによれば、Gemini 1.5は、1時間の動画、11時間の音声、30,000行以上のコード、あるいは70万語以上のテキストなど、膨大な情報を効果的に管理できるとのことです。このモデルは、最大1000万のラベル付きデータポイントを処理できる能力もテストされています。
Gemini 1.5 Proバージョンは、1.0 Ultraと同様に情報処理能力を競いながら、計算効率も高めており、必要な処理パワーを減少させています。標準のコンテキストウィンドウは128,000トークンをサポートしており、特定のバージョンは開発者や企業向けのクライアントに対して最大100万トークンの処理が可能です。
Googleは、Gemini 1.5の能力を示すために、アポロ11号の月面着陸に関する402ページのPDF文書の分析パフォーマンスを強調しました。シンプルなプロンプトにより、Gemini 1.5はニール・アームストロングの着陸に関する質問に見事に回答しました。さらに、バスター・キートンの44分のサイレント映画を効率的に分析し、ナラティブのポイントや出来事を提供し、タイムコードとともに様々なプロンプトに応じて応答しました。
Google Gemini 1.5の発売は、AI技術の進化を意味し、開発者やクラウドコンピューティングのクライアントに対して、その強力な処理能力と幅広い応用可能性を通じて新たなチャンスを提供するものです。