我們已經見證了AI生成圖像的發展有一段時間,但最近,該領域的領先公司取得了顯著進展。本週,來自Midjourney、Google最新模型和Grok的重大更新成為焦點。
這些公司以不同的速度和獨特的方向推進AI技術,競爭空間仍然廣闊,令人著迷的是我們所取得的進步有多大。
Midjourney推出全新網頁編輯器
Midjourney最近推出了一個新的網頁編輯器,將多種圖像處理工具整合到一個用戶友好的介面中。之前,用戶需要在多個選單中瀏覽,例如重新構圖、重塗(修改現有圖像)、平移、畫布延展和縮放。這個精簡的用戶界面顯著提升了編輯體驗,標誌著從原本在Discord上的運作模式的轉變。
Midjourney執行長David Holz表示,目標是讓編輯AI生成的圖像變得「更加無縫」。隨著平台不斷從Discord遷移至網頁應用,Midjourney也將在Discord和網頁房間之間同步“每日主題”、“提示工藝”和“綜合-1”等熱門頻道的活動。此外,一個新的數位畫筆選擇工具取代了傳統的選擇工具,使得編輯過程更加順暢,尤其是對於已在平台上創建超過十幅圖像的用戶。創作者社群的初步反饋非常正面。這次更新是在Midjourney 6.1版本發佈之後,該版本顯著改善了圖像質量、一致性(包括手部細節的準確性)及處理速度。
Grok-2的爭議性推出
在Midjourney更新僅兩天後,Elon Musk的xAI初創公司推出了Grok-2,標誌著AI圖像生成的重要發展。Grok-2由Black Forrest Lab的Flux.1模型驅動,因其卓越的圖像質量和易用性而受到關注。
然而,Grok-2的指導方針引發了擔憂。與其他AI生成器不同,它似乎對知識產權、暴力及露骨內容的規範較少。這種缺乏清晰邊界的情況引發爭議,用戶創造了許多令人不安和非傳統的影像,讓人聯想起AI生成視覺的早期時代。Musk形容Grok-2為「世界上最有趣的AI」,暗示這種放鬆的政策可能是故意的,並可能影響AI技術的未來走向。
Google推出Imagen 3以應對競爭
最後,Google發布了其Imagen 3 AI模型,聲稱這是其「最高質量的文本生成圖像模型」。現在向美國用戶推出的Imagen 3,承諾提供增強的細節、改善的光影效果,以及相比前代產品更少的擾亂性物件。這個模型在文字渲染方面特別有效,並提供多種版本,滿足不同需求,從快速草圖到高解析度圖像。目前,Imagen 3通過Google的AI測試廚房作為ImageFX的一部分可用,但仍處於封閉測試階段,用戶需加入候補名單才能參加。