A arte gerada por IA tornou-se rapidamente uma das aplicações mais fascinantes e populares das novas tecnologias, atraindo milhões de usuários para plataformas como Stable Diffusion e Midjourney. Recentemente, a OpenAI integrou seu modelo de geração de imagens DALL-E 3 ao serviço amplamente utilizado ChatGPT, facilitando ainda mais a criação de imagens. Basta inserir uma descrição para que os usuários vejam como algoritmos de IA transformam suas ideias em arte visual em questão de instantes.
No entanto, em nosso mundo acelerado, esperar alguns segundos pela geração de imagens pode parecer inconveniente.
Esta semana, a comunidade online de arte gerada por IA está agitada com uma técnica inovadora de aprendizado de máquina conhecida como LCM-LoRA, ou Modelo de Consistência Latente com Adaptação de Baixa Classificação. Desenvolvida por pesquisadores da Universidade de Tsinghua e da plataforma de compartilhamento de código HuggingFace, essa técnica permite a criação de arte gerada por IA em tempo real.
O que isso significa de forma prática? Confira vídeos compartilhados por artistas de IA no X e LinkedIn para vê-la em ação. Com o LCM-LoRA, os usuários podem esboçar formas simples ou desenhos de bonecos ao lado de textos descritivos, e aplicações de criação de arte, como Krea.AI e Fal.AI, gerarão instantaneamente novas obras. A imagem pode ser alterada quase que instantaneamente enquanto os usuários manipulam as formas e os desenhos na tela digital.
Você pode experimentar no Fal.AI (se o site permanecer estável durante o aumento de tráfego).
A técnica LCM-LoRA funciona tanto para imagens 2D quanto para ativos 3D, permitindo que os artistas criem ambientes imersivos rapidamente para aplicações em realidade aumentada (AR), realidade virtual (VR), videogames e, potencialmente, na produção de filmes — acelerando significativamente o processo criativo e reduzindo custos.
“Tudo vai mudar”, afirmou um fundador de startup e ex-engenheiro de IA do Google no LinkedIn, um sentimento compartilhado por muitos na comunidade de artes de IA. Outro usuário no X comentou: “Uma nova era de IA generativa está prestes a ser liberada.” O professor Ethan Mollick, da Wharton School of Business, expressou que “veremos muitas novas experiências para os usuários em breve”, graças a essa técnica.
O que é o LCM-LoRA e como funciona?
As demonstrações iniciais da integração do LCM-LoRA em aplicações são, de fato, impressionantes, sugerindo um possível ponto de virada para a IA generativa nas artes visuais.
Mas, qual é a inovação tecnológica por trás do LCM-LoRA? De acordo com os pesquisadores, o LCM-LoRA é um “módulo de aceleração livre de treinamento universal” que pode ser integrado a diversos modelos ajustados do Stable Diffusion.
Em termos mais simples, é um algoritmo que acelera o processo de transformação de texto ou imagens em novas obras de arte geradas por IA usando o popular modelo de código aberto Stable Diffusion e suas versões modificadas.
O LCM-LoRA consegue isso reduzindo o número de “passos de amostragem” que o modelo de IA precisa passar para transformar um texto ou imagem fonte em uma imagem de qualidade superior. Isso significa que permite que os modelos de Stable Diffusion operem de forma mais rápida com menos recursos computacionais, resultando em saídas atraentes em tempo real.
A natureza “universal” do LCM-LoRA significa que é compatível com diferentes aplicações que dependem do Stable Diffusion. Resta saber se poderá ser adaptado para modelos proprietários como o DALL-E 3 da OpenAI ou o Midjourney.
Entramos em contato com um dos autores do artigo sobre LCM-LoRA para mais insights e atualizaremos este artigo assim que mais informações estiverem disponíveis.