Avanço Revolucionário na Geração de Imagens por IA: Transformando o Futuro da Criação Visual

Estamos testemunhando a evolução das imagens geradas por inteligência artificial há algum tempo, e recentemente, empresas líderes na área realizaram avanços significativos. Nesta semana, atualizações notáveis de Midjourney, do modelo mais recente do Google e do Grok estão em destaque.

Cada uma dessas empresas está ultrapassando os limites da tecnologia de IA em ritmos diferentes e em direções únicas. Com o cenário ainda aberto e competitivo, é fascinante observar o quanto já foi alcançado.

Midjourney Lança um Novo Editor Web

O Midjourney apresentou recentemente um novo editor web que reúne diversas ferramentas de manipulação de imagens em uma interface única e amigável. Antes, os usuários precisavam navegar por vários menus para funções como recorte, repintura (modificação de imagens existentes), panorâmica, extensão de tela e zoom. Essa nova interface simplificada melhora significativamente a experiência de edição, marcando uma transição do funcionamento original no Discord.

De acordo com o CEO do Midjourney, David Holz, o objetivo é tornar a edição de imagens geradas por IA “muito mais fluida”. À medida que a plataforma continua sua transição do Discord para um aplicativo web, o Midjourney também sincronizará atividades de canais populares como “daily-theme”, “prompt-craft” e “general-1” em ambas as plataformas. Além disso, uma nova ferramenta de seleção digital substituiu as ferramentas tradicionais, tornando o processo de edição mais ágil para usuários que criaram mais de dez imagens na plataforma. O feedback inicial da comunidade de criadores tem sido amplamente positivo. Essa atualização vem após o lançamento do Midjourney 6.1, que melhorou considerablemente a qualidade da imagem, a coerência (inclusive em detalhes manuais) e a velocidade de processamento.

Lançamento Controverso do Grok-2

Apenas dois dias após a atualização do Midjourney, o Grok-2 foi revelado pela startup xAI de Elon Musk, marcando outro desenvolvimento significativo na geração de imagens por IA. Alimentado pelo modelo Flux.1 do Black Forrest Lab, o Grok-2 está ganhando destaque por sua impressionante qualidade de imagem e acessibilidade.

No entanto, as diretrizes do Grok-2 geram preocupações. Ao contrário de outros geradores de IA, parece ter políticas mínimas em relação à propriedade intelectual, violência e conteúdo explícito. Essa falta de limites claros gerou controvérsia, com usuários criando imagens perturbadoras e incomuns que remetem aos primórdios das imagens geradas por IA. Musk descreveu o Grok-2 como “a IA mais divertida do mundo”, sugerindo que essa leniência pode ser uma escolha deliberada, possivelmente influenciando a trajetória futura da tecnologia de IA.

Google Lança o Imagen 3 para Competir

Por fim, o Google apresentou seu modelo de IA Imagen 3, afirmando ser o “modelo de texto para imagem de mais alta qualidade” até o momento. Lançado para usuários nos EUA, o Imagen 3 promete detalhes aprimorados, melhor iluminação e menos artefatos distrativos em comparação com suas versões anteriores. O modelo é particularmente eficaz na renderização de texto e está disponível em várias versões, atendendo a diferentes necessidades – de esboços rápidos a imagens de alta resolução. Atualmente, o Imagen 3 está acessível através da AI Test Kitchen do Google como parte do ImageFX, embora ainda esteja em beta fechado, exigindo que os usuários se inscrevam em uma lista de espera para participação.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles