在最近的 Google I/O 開發者大會上,公司強調了其人工智慧(AI)技術,提到「AI」超過 120 次。為了幫助您了解在此次活動中揭示的 AI 產品和功能,以下是 2024 年 Google I/O 的主要亮點。
搜尋中的生成式 AI
Google 計畫在搜尋結果中引入生成式 AI,以增強資訊組織能力。當用戶尋求靈感,特別是在計劃旅行時,結果頁面將包含 AI 生成的評論摘要、社交媒體中的討論以及精選建議清單。未來,這些 AI 強化的結果將擴展至飲食選擇、食譜、電影和書籍。
Project Astra 與 Gemini Live
Google 正在提升其 AI 聊天機器人 Gemini,推出一個名為 Gemini Live 的新體驗。用戶將能夠通過智能手機與 Gemini 進行語音聊天,並實時調整問題。這項技術允許 Gemini 使用手機的攝像頭來理解用戶的周圍環境,識別社區或物體。這一創新功能源於 Project Astra,旨在實現 AI 驅動的實時理解。
Google Veo
Google 發布了一款名為 Veo 的新模型,這是一種能夠根據文本提示創建約一分鐘 1080p 影片的工具。Veo 能夠捕捉各種視覺風格,理解攝影機運動和效果,生成高度真實的視頻。此外,Veo 還具備遮罩功能,可以將靜態圖像轉換為動態視頻。
Ask Photos
Google Photos 將推出名為「Ask Photos」的新功能,使用戶能夠利用自然語言查詢自己的照片庫。透過 Gemini 驅動,此功能支持複雜搜尋,如從特定位置檢索最佳照片,預計今夏推出。
Gmail 中的 Gemini
Gmail 用戶即將能夠利用 Gemini 進行搜尋、摘要和撰寫電子郵件。用戶可以指示 Gemini 提取和組織其電子郵件中的關鍵資訊,包括 PDF 附件,幫助用戶輕鬆獲取校園消息或管理收據。
通話中的詐騙檢測
Google 預覽了一項新功能,利用 Gemini Nano 實時檢測通話中的潛在詐騙活動。該功能將包含在即將推出的 Android 版本中,能夠識別與詐騙相關的對話模式。
AI 助力無障礙功能
Google 利用生成式 AI 增強了 TalkBack 的無障礙功能,為視障用戶提供物體的聽覺描述。TalkBack 將自動生成圖像描述,顯著改善視障用戶的無障礙體驗。
這些創新反映了 Google 在 AI 方面的前瞻性,預示著未來將帶來更智能、更便捷的用戶體驗。