O Google Bard Melhora Geração de Imagens e Lança o Avançado Gemini Pro para Competir com o ChatGPT

Home Notícias de IA O Google Bard Melhora Geração de Imagens e Lança o Avançado Gemini Pro para Competir com o ChatGPT

Updated on fevereiro 1 2024

O Google está aprimorando seu chatbot de IA, Bard, para intensificar a competição com o ChatGPT da OpenAI. Sob a liderança de Sundar Pichai, a empresa anunciou a adição de recursos de geração de imagens por meio de seu próprio modelo de IA, o Imagen 2, juntamente com uma versão mais avançada do Gemini Pro. Essas atualizações proporcionam aos usuários um acesso mais amplo às funcionalidades da IA do Bard, incluindo uma nova ferramenta gratuita para criar imagens geradas por IA.

“Essas atualizações posicionam o Bard como um parceiro de IA mais eficiente e acessível globalmente para tarefas que vão desde grandes projetos criativos até atividades do dia a dia”, afirmou Jack Krawczyk, líder de produto do Bard, em um post no blog. Além disso, o Google está testando outro gerador de imagens chamado ImageFX, que começa a ser disponibilizado hoje.

Gemini Pro com Suporte Multilíngue

Há mais de um mês, o Google introduziu o modelo de IA Gemini em três versões: Nano para uso móvel, Pro para aplicações intermediárias e Ultra, que deverá ser o modelo de linguagem mais poderoso já criado—mais avançado que o GPT-4—embora a versão Ultra não esteja prevista para lançamento até o final deste ano. Comparações iniciais entre o Gemini Pro e outros modelos indicaram que ele pode ficar atrás do modelo mais antigo da OpenAI, o GPT-3.5 Turbo. Isso representa um desafio para o Google, que busca demonstrar suas capacidades no competitivo cenário da IA generativa. Uma versão ajustada do Gemini Pro foi lançada no Bard no mês passado, mas estava disponível apenas em inglês.

A nova série de recursos de IA de hoje tem como objetivo ajudar o Google a fechar essa lacuna. A versão mais recente do Bard suportará mais de 40 idiomas—incluindo coreano, espanhol, tâmil, italiano e russo—abrangendo mais de 230 países e territórios. Essa expansão oferece a mais usuários acesso às avançadas capacidades do Gemini Pro em compreensão, sumarização, raciocínio e codificação, além do recurso do Bard que verifica respostas por meio de buscas na web.

Imagen 2 no Bard: Competindo com ChatGPT Plus e DALL-E 3

Um dos desenvolvimentos mais empolgantes é a introdução da geração de imagens por IA utilizando o modelo Imagen 2, projetado para criar imagens de alta qualidade e fotorealistas a partir de comandos de texto. Isso posiciona o Bard como um competidor direto do ChatGPT Plus da OpenAI, que incorpora o gerador de imagens DALL-E 3.

“Basta descrever o que você deseja—como ‘criar uma imagem de um cachorro surfando’—e o Bard gerará uma variedade de visuais para dar vida ao seu conceito”, explicou Krawczyk. Durante os testes, o Bard produziu imagens em aproximadamente 30-40 segundos, demonstrando boa consistência. No entanto, houve ocasiões em que não conseguiu gerar imagens, mesmo seguindo diretrizes que filtram imagens envolvendo indivíduos conhecidos para evitar potenciais escândalos. Atualmente, não há suporte para alterar a proporção da imagem ou utilizar comandos em idiomas diferentes do inglês, com base em nossos testes iniciais da ferramenta.

Para abordar preocupações sobre direitos autorais em conteúdos gerados por IA, o Google Bard permite que os usuários relatem questões legais relacionadas à proteção de dados e direitos autorais para todo o conteúdo gerado. A plataforma também impõe limites para conteúdos violentos, ofensivos ou sexualmente explícitos. Além disso, o Google incorporou marcas d'água digitalmente identificáveis aos pixels das imagens geradas, utilizando o SynthID, desenvolvido pela DeepMind, ajudando a diferenciar visuais gerados por IA daqueles criados por artistas humanos.

Novos Recursos com ImageFX

Além do Bard, o Google está explorando o ImageFX, que é alimentado pelo Imagen 2. Disponível agora no AI Test Kitchen, o aplicativo experimental do Google, o ImageFX incentiva a exploração criativa por meio de “chips expressivos” que fornecem sugestões e dimensões adjacentes para aprimorar os comandos dos usuários. Este recurso é similar a ofertas encontradas em outras ferramentas criativas, como o Ideogram. O AI Test Kitchen também abriga projetos inovadores como o MusicFX, que pode criar melodias de até 70 segundos com comandos de texto e chips expressivos, além do TextFX, voltado para letristas e escritores criativos.

Como a Geração de AI pode Distorcer Transações de Áudio ao Vivo

Allen Institute for AI Lança LLM 'Realmente Open Source' para Impulsionar uma 'Mudança Crítica' no Desenvolvimento de IA

Most people like

AI/ML API

295.3K

Desbloqueie acesso contínuo a mais de 100 modelos de IA por meio de uma única API, possibilitando inovação sem interrupções 24 horas por dia, 7 dias por semana.

Modelos de IA Large Language Models (LLMs)

Skipit

58.4K

Na era digital, o consumo de conteúdo está evoluindo rapidamente, e as plataformas que aproveitam o poder da inteligência artificial estão liderando essa transformação. Nossa plataforma movida a IA resume vídeos do YouTube de forma ágil, permitindo que os usuários compreendam rapidamente insights críticos sem comprometer a qualidade. Além disso, oferece ferramentas robustas para criar chatbots inteligentes, melhorando o engajamento do usuário e automatizando as interações. Descubra como nossas soluções inovadoras podem transformar sua conexão com o conteúdo online e seu público.

Sumarização de vídeo com IA AI YouTube Assistant

录咖

94.6K

Plataforma de processamento de áudio e vídeo impulsionada por IA: aumentando a eficiência e precisão na criação e edição de conteúdo Com o rápido avanço da tecnologia de inteligência artificial, as plataformas de processamento de áudio e vídeo estão transformando o campo da criação de conteúdo de maneiras sem precedentes. Ferramentas impulsionadas por IA podem automatizar a edição, aprimorar a qualidade da imagem e otimizar a qualidade do áudio, aumentando significativamente a eficiência dos criadores. Seja nas mídias sociais, na produção de vídeos ou nas transmissões ao vivo, essas plataformas oferecem soluções inteligentes que tornam a criação de conteúdo mais simples e eficiente. Explore as plataformas de processamento de áudio e vídeo impulsionadas por IA e eleve sua experiência criativa.

Processamento de Áudio e Vídeo AI Video Recording

Controlla: interactive, remixable songs

76.1K

Envolva-se com a música como nunca antes através de canções interativas que capacitam tanto os fãs quanto os artistas. Experimente uma mistura única de criatividade e conexão, transformando a maneira como você aprecia e participa das suas músicas favoritas. Junte-se a uma comunidade vibrante onde a sua voz importa!

música AI Voice Cloning

Find AI tools in YBX