Um pouco mais de um mês após o lançamento de seu avançado modelo de conversão de texto para imagem, a Ideogram lançou uma atualização que introduz várias novas funcionalidades, incluindo referência baseada em descrições e sugestões negativas. Essas melhorias, disponíveis na plataforma web da Ideogram, visam proporcionar aos usuários um maior controle sobre a criação de imagens, ao mesmo tempo em que melhoram a qualidade e a coerência dos resultados. Esta atualização representa um passo significativo para competir com rivais estabelecidos no campo de geração de imagens, como Midjourney e DALL-E.
Novidades na Ideogram
Com o lançamento inicial da versão 1.0 em fevereiro, os usuários ganharam acesso a um recurso de prompt mágico que enriqueceu suas entradas. Com base nessa base, a Ideogram agora introduziu uma nova funcionalidade chamada Descrever, que gera legendas a partir de imagens de referência. Os usuários podem fazer o upload de uma imagem pública gerada pela Ideogram ou de sua própria imagem, levando a IA a produzir uma descrição textual. Essa descrição pode então ser refinada para criar uma imagem semelhante adaptada a necessidades específicas.
Além disso, a Ideogram está implementando sugestões negativas, permitindo que os usuários indiquem o que não desejam em seus resultados. Esse recurso ajuda a eliminar certos objetos ou estilos da geração final. Os usuários também podem escolher entre os modos Rápido, Padrão ou Qualidade para a geração de saídas. O modo Rápido produz imagens básicas em cerca de cinco segundos, enquanto o modo Qualidade foca no fotorrealismo em aproximadamente vinte segundos. O modo Padrão encontra um equilíbrio, gerando imagens em cerca de doze segundos.
Embora a adoção desses modos ainda não tenha sido avaliada, a Ideogram incentiva os usuários a utilizá-los para gerar rapidamente uma imagem básica e depois refiná-la para resultados de maior qualidade.
Fotorrealismo Aprimorado e Renderização de Texto
A Ideogram também está melhorando as capacidades de renderização de texto, com uma redução de 15% nas taxas de erro. Embora essa mudança possa parecer modesta, a empresa afirma que supera o DALL-3 Vivid na geração de caracteres e palavras. Embora não tenham sido compartilhadas estatísticas comparando o modelo atualizado com o Midjourney, a Ideogram afirma que a versão mais recente oferece uma melhor coerência de imagem e fotorrealismo, com avaliadores humanos preferindo-a de 30 a 50% mais do que a versão anterior em alinhamento de prompt, coerência de imagem e qualidade de renderização de texto. Desde o lançamento da beta pública no ano passado, a Ideogram atraiu mais de sete milhões de criadores.
Atualmente, as sugestões negativas e os modos de velocidade são exclusivos para os usuários nos planos Básico e Plus da Ideogram. A disponibilidade do recurso de legenda de imagem de referência ainda não está clara, mas pode ser gratuito, semelhante à funcionalidade Remix. As melhorias em coerência de texto e imagem estão acessíveis a todos os usuários.