人工智慧圖像生成的突破性進展：改變視覺創作的未來

Home AI新聞人工智慧圖像生成的突破性進展：改變視覺創作的未來

我們已經見證了AI生成圖像的發展有一段時間，但最近，該領域的領先公司取得了顯著進展。本週，來自Midjourney、Google最新模型和Grok的重大更新成為焦點。

這些公司以不同的速度和獨特的方向推進AI技術，競爭空間仍然廣闊，令人著迷的是我們所取得的進步有多大。

Midjourney推出全新網頁編輯器

Midjourney最近推出了一個新的網頁編輯器，將多種圖像處理工具整合到一個用戶友好的介面中。之前，用戶需要在多個選單中瀏覽，例如重新構圖、重塗（修改現有圖像）、平移、畫布延展和縮放。這個精簡的用戶界面顯著提升了編輯體驗，標誌著從原本在Discord上的運作模式的轉變。

Midjourney執行長David Holz表示，目標是讓編輯AI生成的圖像變得「更加無縫」。隨著平台不斷從Discord遷移至網頁應用，Midjourney也將在Discord和網頁房間之間同步“每日主題”、“提示工藝”和“綜合-1”等熱門頻道的活動。此外，一個新的數位畫筆選擇工具取代了傳統的選擇工具，使得編輯過程更加順暢，尤其是對於已在平台上創建超過十幅圖像的用戶。創作者社群的初步反饋非常正面。這次更新是在Midjourney 6.1版本發佈之後，該版本顯著改善了圖像質量、一致性（包括手部細節的準確性）及處理速度。

Grok-2的爭議性推出

在Midjourney更新僅兩天後，Elon Musk的xAI初創公司推出了Grok-2，標誌著AI圖像生成的重要發展。Grok-2由Black Forrest Lab的Flux.1模型驅動，因其卓越的圖像質量和易用性而受到關注。

然而，Grok-2的指導方針引發了擔憂。與其他AI生成器不同，它似乎對知識產權、暴力及露骨內容的規範較少。這種缺乏清晰邊界的情況引發爭議，用戶創造了許多令人不安和非傳統的影像，讓人聯想起AI生成視覺的早期時代。Musk形容Grok-2為「世界上最有趣的AI」，暗示這種放鬆的政策可能是故意的，並可能影響AI技術的未來走向。

Google推出Imagen 3以應對競爭

最後，Google發布了其Imagen 3 AI模型，聲稱這是其「最高質量的文本生成圖像模型」。現在向美國用戶推出的Imagen 3，承諾提供增強的細節、改善的光影效果，以及相比前代產品更少的擾亂性物件。這個模型在文字渲染方面特別有效，並提供多種版本，滿足不同需求，從快速草圖到高解析度圖像。目前，Imagen 3通過Google的AI測試廚房作為ImageFX的一部分可用，但仍處於封閉測試階段，用戶需加入候補名單才能參加。

微軟：為何人工智慧無法取代職場中的人類專業知識

什麼是 Grok？深入解析 Elon Musk 有爭議的 ChatGPT 替代品