Após apenas dois meses em versão preview, a Stability AI tem o prazer de lançar seu modelo de AI generativa de próxima geração, o Stable Diffusion 3, juntamente com uma prévia de sua inovadora tecnologia de chatbot, chamada “Stable Assistant”.
Anunciado inicialmente em fevereiro, o Stable Diffusion 3 agora está acessível via API na plataforma de desenvolvedores da Stability AI. Essa API possibilita a fácil integração das poderosas capacidades de geração de imagens a partir de texto em diversos serviços e aplicações. Além disso, foi introduzida uma variante turbo—Stable Diffusion 3 Turbo—para desempenho aprimorado.
Com o Stable Diffusion 3, a Stability AI utiliza técnicas avançadas de aprendizado de máquina para melhorar significativamente a qualidade de imagens e tipografia. Um foco principal durante o lançamento da API foi garantir que o modelo esteja pronto para uso em produção.
“Implementamos inúmeras salvaguardas para evitar o uso indevido do SD3, refinando continuamente essas medidas com base no feedback dos usuários,” afirmou Christian Laforte, CTO e co-CEO interino da Stability AI.
Modelo Aberto em Breve
Enquanto o Stable Diffusion 3 já está disponível via API, um modelo aberto ainda não foi lançado, mas está a caminho. “Continuaremos a aprimorar o modelo antes de sua liberação aberta,” confirmou Laforte. “Em linha com nosso compromisso com a IA generativa aberta, em breve tornaremos os pesos do modelo disponíveis para auto-hospedagem através de uma Associação Stability AI.”
Essa estratégia de associação, anunciada pela primeira vez em dezembro, visa estabelecer um novo modelo de receita para a empresa.
Parceria com Fireworks Melhora Desempenho da API
A parceria da Stability AI com a Fireworks AI melhorará o desempenho da API do Stable Diffusion 3. A otimização da inferência da API para aplicações de IA generativa—especialmente em grande escala—pode ser complexa, mas a expertise da Fireworks AI em compiladores de aprendizado de máquina ajudará a enfrentar esses desafios.
“Fireworks AI são especialistas líderes em compiladores de ML, um componente vital para otimizar a velocidade de inferência de nossos modelos,” observou Laforte. “Ao nos associar a eles, conseguimos fornecer a plataforma de API empresarial mais rápida e confiável do mercado.”
Inovações no Stable Diffusion 3
No cerne do Stable Diffusion está o modelo de difusão, com várias inovações que ampliam suas capacidades. Destaca-se a introdução da arquitetura Multimodal Diffusion Transformer (MMDiT), que melhora a compreensão de texto e a precisão tipográfica.
Para o modelo SD3-Turbo, que oferece desempenho mais veloz, é utilizado um método inovador chamado Latent Adversarial Diffusion Distillation (LADD). “Essencialmente, o SD3-Turbo é até 10 vezes mais rápido que o SD3, produzindo imagens de qualidade quase equivalente,” explicou Laforte.
Apresentando o Stable Assistant
Além do novo modelo Stable Diffusion, a Stability AI lançou uma beta inicial do Stable Assistant, um chatbot alimentado pela tecnologia de geração de texto e imagem da empresa. Semelhante à integração do ChatGPT Plus da OpenAI com o DALL-E 3, o Stable Assistant permite a geração de imagens por meio de conversas.
Laforte descreve o Stable Assistant como um chatbot amigável que combina as capacidades do Stable Diffusion 3 e do Stable LM 2 12B, recém-lançado. Essa ferramenta não apenas gera imagens a partir de discussões, mas também fornece respostas informativas, auxilia em projetos de escrita e enriquece conteúdos com imagens relevantes.
“Stable Assistant pretende se tornar nosso chatbot multimodal, oferecendo acesso a todos nossos modelos e serviços de API sem a necessidade de expertise técnica,” afirmou Laforte. “Planejamos continuar aprimorando suas capacidades, adicionando edição de imagens e incorporando modelos de outras modalidades, incluindo vídeo, 3D, áudio e código.”