Google Bard 強化影像生成技術,推出先進的 Gemini Pro,以與 ChatGPT 競爭

谷歌正在升級其Bard AI聊天機器人,以加強與OpenAI的ChatGPT的競爭。在Sundar Pichai的指導下,谷歌宣布通過其Imagen 2 AI模型新增圖像生成能力,同時推出更高級的Gemini Pro版本。

這些更新使用戶能更廣泛地接觸到Bard的AI功能,包括一個全新的免費AI圖像生成工具。Bard的產品負責人Jack Krawczyk在博客中表示:“這些更新使Bard成為一個更高效、全球可及的AI合作夥伴,適用於從大型創意項目到日常活動的各種任務。”

此外,谷歌今天開始測試另一個名為ImageFX的圖像生成器。

Gemini Pro與多語言支持

在一個多月前,谷歌推出了Gemini AI模型,分為三個版本:適用於移動端的Nano版、中級應用的Pro版和預期為最強大的Ultra版,Ultra版將超越GPT-4,儘管預計直到今年晚些時候才發布。

初步比較顯示,Gemini Pro可能在某些方面不如OpenAI的舊版GPT-3.5 Turbo。這對谷歌來說是一個挑戰,因為它希望在生成AI的競爭格局中展示其能力。上個月,針對Bard發布了一個針對Gemini Pro的微調版本,但當時僅支持英語。

今天推出的新一系列AI功能旨在幫助谷歌彌補這一差距。Bard的最新版本將支持超過40種語言,包括韓語、西班牙語、泰米爾語、意大利語和俄語,遍及230多個國家和地區。這一擴展使更多用戶能夠獲得Gemini Pro在理解、摘要、推理和編程方面的先進能力,同時結合Bard的網絡搜尋功能以驗證回答的準確性。

Imagen 2於Bard上:與ChatGPT Plus和DALL-E 3競爭

或許最令人興奮的發展是利用Imagen 2模型進行AI圖像生成,該模型旨在從文本提示中創作高品質的寫實圖像,這使Bard成為OpenAI的ChatGPT Plus(包含DALL-E 3圖像生成器)的直接競爭對手。

Krawczyk解釋說:“只需簡單描述您想要的內容,比如‘創建一幅狗在衝浪板上騎行的圖像’,Bard將生成多種視覺效果來實現您的概念。”在測試中,Bard大約在30-40秒內生成圖像,顯示出相當穩定的效果。然而,在一些情況下,儘管遵循了過濾知名人物形象的指導方針以避免潛在爭議,它仍未能生成圖像。

根據我們對該工具的初步測試,目前不支持調整畫面比例或使用非英語提示。

為解決圍繞AI生成媒體的版權問題,谷歌Bard允許用戶上報與數據保護和版權相關的法律問題。該平台還限制暴力、冒犯性或色情內容。此外,谷歌已將由DeepMind開發的SynthID嵌入生成圖像的像素中,以便數位識別水印,幫助區分AI生成的視覺作品與人類藝術家創作的作品。

ImageFX的新版本功能

除了Bard,谷歌還在探索由Imagen 2驅動的ImageFX。該功能現在可在AI Test Kitchen——谷歌的實驗應用中使用,ImageFX通過“表現力芯片”鼓勵創意探索,為用戶提供建議和相鄰的維度,從而增強其提示。該功能類似於其他創意工具中的功能,如Ideogram。

AI Test Kitchen還推出了創新項目,如MusicFX,能夠根據文本提示和表現力芯片創作長達70秒的旋律,還有針對作詞家和創意作家的TextFX。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles