谷歌推出增強版生成 AI 工具:Imagen 3 和 Gems
谷歌本週正式推出其增強版生成 AI 工具,包含下一代圖像生成器 Imagen 3。此次更新重新加入了先前被移除的功能,使得生成 AI 人物圖像成為可能,克服了之前圍繞此功能的爭議。此外,谷歌的新 Gemini 聊天機器人現已包含「Gems」功能,使用戶能夠創建具個性化指令的自定義機器人,類似於 ChatGPT 的自定義 GPT。
Imagen 3:提升圖像生成質量
Imagen 3 旨在設立圖像質量的新標準,內建防護措施以避免先前版本的多樣性問題。根據 Gemini 產品經理 Dave Citron 的說法,「在多個基準測試中,Imagen 3 的表現優於其他圖像生成模型。」此更新工具允許用戶使用補充提示導引圖像創作,以便初始輸出不符合預期時進行調整。
新的模型還結合了谷歌的 SynthID 技術,對圖像進行水印標註,明確標示為 AI 生成,避免與真實照片混淆。Citron 表示,生成人物圖像的功能將會很快為付費用戶提供,並設有保障措施,禁止創建「具攝影真實感的可識別個體」以及包含兒童或任何露骨、暴力或性內容的圖像。他承認 Gemini 的圖像可能不完美,但保證公司將根據反饋持續改進模型。
介紹 Gems:自定義聊天機器人提升功能
Gems 最初在谷歌 I/O 2024 上預覽,允許用戶創建針對特定任務的自定義聊天機器人。此功能為需要協助的用戶提供了解決方案,包括項目執行、腦力激盪甚至撰寫社交媒體標題。Citron 強調,「您的 Gem 可以記住詳細的指令,幫助您節省繁瑣、重複或挑戰性任務的時間。」
為促進用戶參與,Gemini 還將提供預製的 Gems,旨在激發創意並簡化工作流程。可用的預製 Gems 包括:
- 學習教練:協助理解複雜主題。
- 腦力激盪器:激發項目新想法。
- 職業指導:幫助提升技能和職業決策。
- 寫作編輯器:提供語法和結構的建設性反饋。
- 編碼夥伴:幫助開發者提升編碼技能,激發新項目。
今日,Gems 已在桌面和手機推出,但目前僅限於 Gemini 高級、商業和企業訂閱用戶使用。為了利用這些創新功能,用戶需選擇付費計劃。
透過增強 AI 能力,谷歌旨在提供更直觀有效的工具,回應對先進生成技術日益增長的需求。