最近のGoogle I/O開発者会議では、同社が人工知能(AI)技術に力を入れており、「AI」という言葉が120回以上使用されました。ここでは、2024年Google I/Oで発表されたAI製品や機能の主要なポイントを紹介します。
検索における生成AI
Googleは、検索結果に生成AIを導入し、情報の整理を強化する計画です。特に旅行の計画を立てる際に、ユーザーは、レビューのAI生成サマリーやソーシャルメディアからの議論、厳選された提案リストが表示される結果ページを受け取ります。将来的には、料理やレシピ、映画、書籍に関してもAI強化結果が拡大される予定です。
プロジェクトアストラとGeminiライブ
Googleは、AIチャットボット「Gemini」を新しい体験「Geminiライブ」とともに強化しています。ユーザーはスマートフォンを介してGeminiとの音声チャットを行い、その場で質問を調整できるようになります。この技術により、Geminiはカメラを使用してユーザーの周囲を理解し、地域や物体を特定することが可能になります。この革新的な機能は、AIによるリアルタイム理解を目指すプロジェクトアストラに基づいています。
Google Veo
Googleは「Veo」という新しいモデルを発表しました。これは、テキストプロンプトから約1分の1080p動画を生成できるツールです。Veoはさまざまなビジュアルスタイルをキャプチャし、カメラの動きや効果を理解して、非常にリアルな動画を生成します。また、マスキング機能を備え、静止画像を動的な動画に変換することも可能です。
Ask Photos
Google Photosは新機能「Ask Photos」を導入します。これにより、ユーザーは自然言語で自分の写真コレクションを検索できるようになります。Geminiの力を借りたこの機能は、特定の場所からベストな写真を取得するなど、複雑な検索を可能にします。夏に提供される予定です。
GmailにおけるGemini
Gmailユーザーは、近くGeminiを利用してメールの検索、要約、下書きができるようになります。ユーザーはGeminiに指示して、メール内の重要な情報を抽出・整理させ、学校のニュースや領収書を管理しやすくします。
通話中の詐欺検出
Googleは、通話中にリアルタイムで詐欺の可能性を検出する新機能を発表しました。この機能は、今後のAndroidバージョンに含まれ、詐欺に関連する会話パターンを特定します。
AIによるアクセシビリティの向上
Googleは、視覚障害者向けに生成AIを利用して「TalkBack」アクセシビリティ機能を強化しました。TalkBackは、画像の自動説明を生成し、視覚障害者のアクセシビリティ体験を大幅に向上させます。
これらの革新は、GoogleのAIに対する積極的なアプローチを反映しており、将来的にはよりスマートで便利なユーザー体験を約束しています。