O Google Bard Melhora Geração de Imagens e Lança o Avançado Gemini Pro para Competir com o ChatGPT

O Google está aprimorando seu chatbot de IA, Bard, para intensificar a competição com o ChatGPT da OpenAI. Sob a liderança de Sundar Pichai, a empresa anunciou a adição de recursos de geração de imagens por meio de seu próprio modelo de IA, o Imagen 2, juntamente com uma versão mais avançada do Gemini Pro. Essas atualizações proporcionam aos usuários um acesso mais amplo às funcionalidades da IA do Bard, incluindo uma nova ferramenta gratuita para criar imagens geradas por IA.

“Essas atualizações posicionam o Bard como um parceiro de IA mais eficiente e acessível globalmente para tarefas que vão desde grandes projetos criativos até atividades do dia a dia”, afirmou Jack Krawczyk, líder de produto do Bard, em um post no blog. Além disso, o Google está testando outro gerador de imagens chamado ImageFX, que começa a ser disponibilizado hoje.

Gemini Pro com Suporte Multilíngue

Há mais de um mês, o Google introduziu o modelo de IA Gemini em três versões: Nano para uso móvel, Pro para aplicações intermediárias e Ultra, que deverá ser o modelo de linguagem mais poderoso já criado—mais avançado que o GPT-4—embora a versão Ultra não esteja prevista para lançamento até o final deste ano. Comparações iniciais entre o Gemini Pro e outros modelos indicaram que ele pode ficar atrás do modelo mais antigo da OpenAI, o GPT-3.5 Turbo. Isso representa um desafio para o Google, que busca demonstrar suas capacidades no competitivo cenário da IA generativa. Uma versão ajustada do Gemini Pro foi lançada no Bard no mês passado, mas estava disponível apenas em inglês.

A nova série de recursos de IA de hoje tem como objetivo ajudar o Google a fechar essa lacuna. A versão mais recente do Bard suportará mais de 40 idiomas—incluindo coreano, espanhol, tâmil, italiano e russo—abrangendo mais de 230 países e territórios. Essa expansão oferece a mais usuários acesso às avançadas capacidades do Gemini Pro em compreensão, sumarização, raciocínio e codificação, além do recurso do Bard que verifica respostas por meio de buscas na web.

Imagen 2 no Bard: Competindo com ChatGPT Plus e DALL-E 3

Um dos desenvolvimentos mais empolgantes é a introdução da geração de imagens por IA utilizando o modelo Imagen 2, projetado para criar imagens de alta qualidade e fotorealistas a partir de comandos de texto. Isso posiciona o Bard como um competidor direto do ChatGPT Plus da OpenAI, que incorpora o gerador de imagens DALL-E 3.

“Basta descrever o que você deseja—como ‘criar uma imagem de um cachorro surfando’—e o Bard gerará uma variedade de visuais para dar vida ao seu conceito”, explicou Krawczyk. Durante os testes, o Bard produziu imagens em aproximadamente 30-40 segundos, demonstrando boa consistência. No entanto, houve ocasiões em que não conseguiu gerar imagens, mesmo seguindo diretrizes que filtram imagens envolvendo indivíduos conhecidos para evitar potenciais escândalos. Atualmente, não há suporte para alterar a proporção da imagem ou utilizar comandos em idiomas diferentes do inglês, com base em nossos testes iniciais da ferramenta.

Para abordar preocupações sobre direitos autorais em conteúdos gerados por IA, o Google Bard permite que os usuários relatem questões legais relacionadas à proteção de dados e direitos autorais para todo o conteúdo gerado. A plataforma também impõe limites para conteúdos violentos, ofensivos ou sexualmente explícitos. Além disso, o Google incorporou marcas d'água digitalmente identificáveis aos pixels das imagens geradas, utilizando o SynthID, desenvolvido pela DeepMind, ajudando a diferenciar visuais gerados por IA daqueles criados por artistas humanos.

Novos Recursos com ImageFX

Além do Bard, o Google está explorando o ImageFX, que é alimentado pelo Imagen 2. Disponível agora no AI Test Kitchen, o aplicativo experimental do Google, o ImageFX incentiva a exploração criativa por meio de “chips expressivos” que fornecem sugestões e dimensões adjacentes para aprimorar os comandos dos usuários. Este recurso é similar a ofertas encontradas em outras ferramentas criativas, como o Ideogram. O AI Test Kitchen também abriga projetos inovadores como o MusicFX, que pode criar melodias de até 70 segundos com comandos de texto e chips expressivos, além do TextFX, voltado para letristas e escritores criativos.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles