平面設計師會被取代嗎?COLE 利用人工智慧瞬間創建可編輯設計

設計師注意:一款新工具可能改變遊戲規則

引入COLE,這是一款以亨利·科爾(Henry Cole)命名的突破性工具,他在1843年首創了圖形聖誕卡。這個創新平台允許用戶輸入圖形設計的想法——例如「為冬季音樂會製作海報,背景是穿著暖和衣服的音樂家在飄雪中」——並利用人工智慧生成圖像和配文。

什麼是COLE?

COLE由多個先進的AI模型組成,包括經過微調的Meta Llama2-13B、DeepFloyd IF、LLaVA1.5-13B及GPT-4V,並結合開源圖形渲染器Skia。這個團隊由來自微軟亞洲研究院和北京大學的12名研究人員組成,專注於解決圖形設計的複雜性及關鍵格式(特別是.SVG文件)的訓練數據匱乏問題。研究人員將SVG元素簡化為統一的圖像層,使AI能夠通過文本描述背景層。COLE的背景模型基於從互聯網獲得的10萬幅高質量圖形設計圖片進行訓練。

不僅僅是一個產品

目前,COLE更多地作為一個框架,而非商業產品。然而,它的功能令人印象深刻。用戶只需輸入提示,COLE便能創建清晰、有序的圖形設計,無縫結合視覺和風格化文本。這標誌著一個重要的進步,因為生成整合文本和圖像一直是許多AI藝術生成器的挑戰,包括Midjourney和DALL-E 3等領先者。

可編輯的AI生成設計

COLE最引人注目的特點或許是其能夠生成可編輯的文本和視覺元素。用戶可以在框架內直接修改文本,而無需導出到像Adobe Photoshop或InDesign等軟件。例如,他們可以輕易地更改字體或調整視覺效果,將一個購物袋的寫實風格轉變為卡通風格。根據研究人員最近的arXiv論文,「一個可擴展的高質量圖形設計生成系統應該要求用戶付出最少的努力,產出準確的排版,並提供靈活的編輯選項。」COLE實現了這一目標。

競爭力的圖形設計品質

研究人員聲稱,COLE的產出「非常具有競爭力」,即使與DALL-E 3相比也不遑多讓。他們在200個圖形設計項目中徹底測試了COLE,這些項目涵蓋廣告及活動促銷,並為透明度記錄了其提示。COLE在生成封面、標題和海報時表現最佳,顯示出對特定元素的編輯能力優於DALL-E 3及類似工具。

然而,COLE尚未成為完整解決方案。用戶無法改變文本塊的排列,目前工具僅允許每幅圖像使用一種字體顏色。研究人員計劃在未來的開發中解決這些限制。

圖形設計師的新時代?

高質量的圖形設計往往被視作理所當然,但它實際上是一種藝術形式。無論是音樂會海報還是功能性圖形如交通標誌,設計都反映了技術和創意。

COLE是否對圖形設計師構成威脅?答案是微妙的。雖然COLE的可編輯字段幫助用戶精煉產出並借助人類專業知識,但它簡化了一個傳統需要專業技能才能開發有效提示的過程。這讓沒有正式訓練的人也能達成漂亮的設計。

本質上,COLE旨在使高質量圖形設計民主化,這一概念已被Adobe和Canva等公司探索。在這方面,COLE可能成為競爭者,並可能增強市場上現有工具的功能。

目前,COLE尚未公開,將在其GitHub項目頁面上發布演示。

Most people like

Find AI tools in YBX