Заменят ли графических дизайнеров? COLE использует ИИ для мгновенного создания редактируемых дизайнов.

Дизайнеры, обратите внимание: новый инструмент может изменить правила игры

Представляем COLE — революционный инструмент, названный в честь Генри Коула, автора первой графической рождественской открытки в 1843 году. Эта инновационная платформа позволяет пользователям вводить идеи для графического дизайна, такие как "плакат для зимнего концерта с музыкантами в теплой одежде на фоне падающего снега", и использует ИИ для генерации как изображения, так и сопутствующего текста.

Что такое COLE?

COLE — это комбинация передовых моделей ИИ, включая тонко настроенные версии Meta Llama2-13B, DeepFloyd IF, LLaVA1.5-13B и GPT-4V, дополненные графическим рендерером Skia с открытым исходным кодом. Разработанная командой из 12 исследователей Microsoft Research Asia и Пекинского университета, COLE решает проблемы графического дизайна и нехватки обучающих данных по ключевым форматам, особенно .SVG файлам. Исследователи объединили элементы SVG в единый слой изображения, что позволяет ИИ описывать фоновые слои через текст. Модель для генерации фона была обучена на коллекции из 100 000 качественных графических изображений, собранных из интернета.

Больше, чем просто продукт

На данный момент COLE больше похож на платформу, чем на коммерческий продукт. Тем не менее, его возможности впечатляют. Всего лишь введя подсказки, COLE может создавать четкие и организованные графические дизайны, которые seamlessly интегрируют визуальные элементы и стилизованный текст. Это значительное достижение, поскольку генерация интегрированного текста и изображений оставалась сложной задачей для многих генераторов ИИ, включая таких лидеров, как Midjourney и DALL-E 3.

Редактируемые дизайны, созданные ИИ

Самая примечательная функция COLE — это способность производить изображения с редактируемыми текстами и визуальными элементами. Пользователи могут изменять текст непосредственно в рамках платформы, без необходимости экспорта в такие программы, как Adobe Photoshop или InDesign. Например, они могут легко изменить шрифт или адаптировать визуальные элементы, преобразуя пакет для продуктов из фотореалистического стиля в мультяшное представление.

Согласно исследователям в их недавней статье на arXiv, "масштабируемая система генерации графического дизайна высокого качества должна требовать минимальных усилий от пользователей, обеспечивать точную типографику и предлагать гибкие возможности редактирования". С COLE они достигли этой цели.

Конкурентоспособное качество в графическом дизайне

Исследователи утверждают, что COLE производит результаты "очень конкурентного качества" даже по сравнению с DALL-E 3. Они тщательно протестировали COLE на 200 проектах графического дизайна от рекламы до промоушенов мероприятий, документируя свои подсказки для прозрачности. COLE показывает лучшие результаты при создании обложек, заголовков и плакатов, демонстрируя превосходные способности редактирования конкретных элементов по сравнению с DALL-E 3 и аналогичными инструментами.

Однако COLE пока не является полноценным решением. Пользователи не могут изменять расположение текстовых блоков, а инструмент в настоящее время позволяет использовать только один цвет типографии на изображение. Исследователи планируют устранить эти ограничения в будущих обновлениях.

Новая эра для графических дизайнеров?

Графический дизайн высокого качества часто воспринимается как должное, хотя это является искусством. Дизайны — будь то концертные постеры или функциональная графика, такая как дорожные знаки — отражают мастерство и креативность.

Представляет ли COLE угрозу для графических дизайнеров? Ответ неоднозначен. Хотя редактируемые поля COLE позволяют пользователям уточнять результаты и использовать человеческий опыт, инструмент облегчает процесс, который традиционно требует профессиональных навыков для разработки эффективных подсказок. Это делает привлекательные дизайны доступными для тех, кто не имеет формального обучения.

В сущности, COLE нацелен на демократизацию высококачественного графического дизайна, концепция которого уже исследуется такими компаниями, как Adobe и Canva. В этом смысле COLE может стать конкурентом и потенциально улучшить существующие инструменты на рынке.

Пока что COLE не доступен для широкой публики, но демонстрация вскоре будет опубликована на их странице проекта на GitHub.

Most people like

Find AI tools in YBX