Google 發布 Imagen 3：終極文本轉圖像模型現已進入私人預覽階段

Home AI新聞 Google 發布 Imagen 3：終極文本轉圖像模型現已進入私人預覽階段

Google即將推出其文本轉圖像模型Imagen 3的重大更新，該模型承諾提供更詳細的畫面、更佳的自然語言理解能力以及優化的文本渲染功能。目前，Imagen 3在ImageFX上對部分創作者開放私密預覽，開發者可以加入候補名單以獲取訪問權限。此外，Imagen 3預計將整合進Vertex AI。

谷歌DeepMind的高級研究總監道格拉斯·艾克在公司I/O開發者大會上表示：「這是我們迄今為止最先進的圖像生成模型。Imagen 3提供了更高的真實感、更豐富的細節，並顯著減少了視覺瑕疵和扭曲。它以對話方式理解提示——您提供的創意和細節越多，輸出效果就越好。Imagen 3在長提示中加入微妙元素的能力十分突出，並在文本渲染方面代表了我們迄今為止的最佳努力，這是圖像生成模型面臨的共同挑戰。」

這一消息發布距離Google在Vertex AI上廣泛推出Imagen 2僅六個月，此前在四月發布了文本轉實時功能。隨著OpenAI的DALL-E、Midjourney、Adobe的Firefly、Meta的AI和微軟的Designer等AI圖像生成工具的激烈競爭，Google必須保持領先地位。

然而，谷歌在這一領域的旅程並非一帆風順。今年早些時候，該公司因其AI生成的圖片遭到攻擊，批評者指責這些圖片「過於政治正確」，包括描繪美國開國元勳與一名黑人男子以及第二次世界大戰德國士兵旁邊有一名黑人男子和一位亞洲女性的形象。谷歌承認了這一失誤，首席執行官桑達爾·皮查伊在接受彭博社訪問時重申了道歉。

Imagen 3的發布是Google I/O上幾個激動人心的更新之一，還包括新視頻生成模型Veo的推出。

Google 發佈 Veo：一款令人驚豔的生成式 AI 影片模型，旨在與 OpenAI 的 Sora 競爭

Google推出Firebase Genkit：打造AI驅動應用程式的終極開發框架

Most people like

SlideAI

38.9K

您是否時間緊迫卻需要呈現引人入勝的演示文稿？憑藉我們的創新工具，您可以在幾分鐘內製作出令人驚豔的演示。告別漫長的準備時間，迎接充滿活力的專業幻燈片，吸引觀眾的目光。探索如何輕鬆將您的想法轉化為視覺吸引力強的演示，而不妥協品質。

人工智慧驅動 AI Presentation Generator

Transcript

36.2K

釋放您的學術潛力，使用專為學生設計的終極學習工具。快速獲取見解，深入理解複雜主題。提升您的解決問題能力，迅速推進學業成長！

學習工具 AI Response Generator

lipsyncer.ai

17K

介紹一個先進的平台，專為創作迷人的 AI 生成口型同步視頻而設計。利用我們直觀的工具和技術，簡化您的內容創作流程，前所未有地吸引您的觀眾。無論您是內容創作者、市場營銷者，還是單純想要享樂，我們的平台都能讓您輕鬆製作高質量的口型同步視頻。立即加入，釋放您的創意吧！

對嘴影片 AI Lip Sync Generator

XspaceGPT

44.9K

探索我們專為將 Twitter Spaces 轉換為文字而設計的 AI 工具的強大功能。輕鬆轉寫來自 Twitter Spaces 的對話、講座和討論，輕鬆捕捉每一個有見地的時刻。藉助我們的先進技術，您可以提升可及性、做筆記或將內容重新利用於部落格和文章。加入這個日益壯大的社群，利用 AI 簡化他們的 Twitter Spaces 體驗！

AI 文字轉換 Summarizer

Find AI tools in YBX