A Stability AI Expande Capacidades de Geração de Imagem com Stable Diffusion Medium

Home Notícias de IA A Stability AI Expande Capacidades de Geração de Imagem com Stable Diffusion Medium

Maior nem sempre é melhor, especialmente ao executar modelos de IA generativa em hardware comum. Este princípio é a base do mais recente lançamento da Stability AI: o Stable Diffusion 3 Medium. Como o modelo principal da Stability AI, o Stable Diffusion se destaca na geração de imagens a partir de texto. Uma prévia do Stable Diffusion 3 foi compartilhada em 22 de fevereiro, com o acesso público à API disponível a partir de 17 de abril.

O novo Stable Diffusion Medium foi projetado para ser um modelo menor, mas altamente eficiente, que opera de forma eficaz em GPUs de nível consumidor. Isso torna o Stable Diffusion 3 uma opção atraente para usuários e organizações com recursos limitados que buscam tecnologia eficaz de geração de imagens.

O Stable Diffusion Medium está disponível para teste via API e no serviço Stable Artisan através do Discord. Além disso, os pesos do modelo podem ser acessados para uso não comercial no Hugging Face.

Com a introdução do Stable Diffusion Medium, a versão inicial agora é conhecida como Stable Diffusion 3 (SD3) Large, que possui 8 bilhões de parâmetros. Em contrapartida, o SD3 Medium conta com 2 bilhões de parâmetros. Segundo Christian Laforte, co-CEO da Stability AI, "diferente do SD3 Large, o SD3 Medium é menor e funcionará de forma eficiente em hardware comum."

Para rodar o Stable Diffusion Medium, os usuários precisam apenas de 5GB de VRAM na GPU, permitindo sua operação em diversos PCs e laptops de alta performance. Embora essa seja a exigência mínima, a Stability AI recomenda 16GB de VRAM para desempenho otimizado, o que pode ser um desafio para alguns laptops.

Apesar de seu tamanho reduzido, o SD3 Medium apresenta recursos impressionantes comparáveis ao SD3 Large. Laforte destaca que o SD3 Medium brilha no fotorealismo, na aderência a prompts, na tipografia, na eficiência de recursos e no ajuste fino. "O SD3 Medium iguala as capacidades da API do SD3 Large que os usuários apreciam hoje," afirmou.

Os usuários podem esperar saídas de imagens altamente realistas do SD3, graças ao VAE (Variational Autoencoder) de 16 canais, que oferece maior detalhamento por megapixel em comparação aos modelos anteriores. O SD3 também demonstra uma notável aderência a prompts em linguagem natural, incluindo consciência espacial na composição de imagens.

As capacidades de ajuste fino do modelo o tornam altamente adaptável e eficiente na captura de detalhes a partir de conjuntos de dados de ajuste fino. Uma melhoria significativa presente no SD3 que é mantida no SD3 Medium é a tipografia aprimorada.

O recurso mais notável do SD3 Medium é sua eficiência em recursos. "O tamanho menor e a modularidade do modelo de 2 bilhões de parâmetros reduzem os requisitos computacionais sem sacrificar o desempenho," observou Laforte. "Isso torna o SD3 Medium uma escolha ideal em ambientes onde a gestão de recursos é crítica."

Executivo da Verizon Revela Estratégia de IA Responsável em um Cenário em Evolução de 'Faroeste'

Databricks Lança o Unity Catalog como Código Aberto: Uma Revolução na Interoperabilidade de Dados para Workloads, Desafiando a Snowflake

Most people like

FreeAdCopy

85.5K

Revolucione sua estratégia de publicidade com nossa ferramenta de IA de ponta, projetada para gerar instantaneamente textos publicitários cativantes. Transforme a forma como você cria conteúdo de marketing, garantindo que sua mensagem ressoe com seu público e economize tempo e esforço. Descubra o poder da inteligência artificial na criação de anúncios eficazes que aumentam o engajamento e potencializam as conversões.

Gerador de texto com IA AI Advertising Assistant

Suno AI Music

73.4K

Nos últimos anos, plataformas de geração de música por IA revolucionaram a forma como criamos e interagimos com a música. Essas tecnologias inovadoras utilizam algoritmos avançados e aprendizado de máquina para compor canções, desenvolver paisagens sonoras únicas e auxiliar músicos em seus processos criativos. Ao combinar a criatividade humana com o poder da inteligência artificial, essas plataformas oferecem oportunidades sem precedentes para artistas, produtores e amantes da música, tornando a criação musical mais acessível e inspiradora. Explore o fascinante mundo da geração musical por IA e descubra como está transformando o futuro do som.

Geração de música por IA AI Music Generator

Vellum

157K

Apresentamos uma plataforma de desenvolvimento de ponta, projetada especialmente para a criação de aplicações de modelos de linguagem de grande escala (LLM). Esta plataforma inovadora torna o processo de desenvolvimento mais ágil, fornecendo aos desenvolvedores as ferramentas e recursos necessários para construir, testar e implantar soluções poderosas baseadas em LLM de forma eficiente. Seja você um desenvolvedor experiente ou esteja apenas começando, nossa plataforma oferece a flexibilidade e o suporte para dar vida às suas ideias de IA. Junte-se a nós na revolução do desenvolvimento de aplicações LLM!

Aplicativos de LLM AI Developer Tools

Kive

88K

Kive é uma plataforma de IA inovadora projetada para gerenciar ativos criativos de forma integrada, inspirar a colaboração e aprimorar o processo criativo.

Plataforma impulsionada por IA AI Presentation Generator

Find AI tools in YBX