Google Apresenta Ferramentas Aprimoradas de IA Generativa: Imagen 3 e Gems
O Google está melhorando suas ferramentas de IA generativa, começando esta semana com o lançamento do Imagen 3, a nova versão do seu gerador de imagens. Esta atualização reintroduz a capacidade de gerar imagens de pessoas, uma função que havia sido removida anteriormente em meio a controvérsias. Além disso, o novo chatbot Gemini agora conta com “Gems”, uma funcionalidade que permite aos usuários criar bots personalizados com instruções específicas, semelhante aos GPTs customizados do ChatGPT.
Imagen 3: Geração de Imagens Aprimorada
O Imagen 3 estabelece um novo padrão de qualidade de imagem, equipado com guardrails integrados para evitar problemas de diversidade que afetaram iterações anteriores. Segundo Dave Citron, Gerente de Produto do Gemini, “em uma ampla gama de benchmarks, o Imagen 3 apresenta um desempenho favorável em comparação a outros modelos de geração de imagens.” A ferramenta atualizada permite que os usuários orientem a criação da imagem com prompts adicionais caso o resultado inicial não satisfaça as expectativas.
O novo modelo também incorpora a tecnologia SynthID do Google para marcar imagens, identificando claramente que são geradas por IA, evitando confusões com fotografias reais. Citron mencionou que a capacidade de gerar imagens de pessoas estará disponível em breve para usuários pagos, com garantias para proibir a criação de “indivíduos fotorealistas e identificáveis”, bem como imagens com crianças ou conteúdo gráfico, violento ou sexual. Embora reconheça que as imagens do Gemini podem não ser perfeitas, ele assegurou aos usuários que a empresa continuará aprimorando o modelo com base no feedback recebido.
Apresentando Gems: Chatbots Personalizados para Funcionalidade Aprimorada
As Gems, inicialmente apresentadas no Google I/O 2024, permitem que os usuários criem chatbots personalizados para tarefas específicas. Essa funcionalidade oferece uma solução para quem precisa de auxílio em projetos, sessões de brainstorming ou até na criação de legendas para redes sociais. Citron enfatizou: “Sua Gem pode armazenar um conjunto detalhado de instruções para ajudá-lo a economizar tempo em tarefas tediosas, repetitivas ou desafiadoras.”
Para facilitar o engajamento dos usuários, o Gemini oferecerá também Gems pré-construídas, projetadas para inspirar criatividade e otimizar processos de trabalho. Algumas das Gems disponíveis incluem:
- Treinador de Aprendizado: Auxilia na compreensão de tópicos complexos.
- Gerador de Ideias: Estimula novas ideias para projetos.
- Orientador de Carreira: Ajuda na atualização de habilidades e decisões profissionais.
- Editor de Texto: Fornece feedback construtivo sobre gramática e estrutura.
- Parceiro de Programação: Ajuda desenvolvedores a aprimorar habilidades de codificação e inspirar novos projetos.
As Gems estão sendo lançadas hoje para desktop e mobile, mas atualmente estão acessíveis apenas para assinantes do Gemini Advanced, Business e Enterprise. Para utilizar esses recursos inovadores, os usuários precisarão optar por um plano pago.
Através do aprimoramento de suas capacidades de IA, o Google visa oferecer ferramentas mais intuitivas e eficazes, respondendo à crescente demanda por tecnologias generativas sofisticadas.