O Google lançou o Gemini 1.5, a versão mais recente de seu sistema de IA conversacional, que apresenta melhorias significativas em eficiência, desempenho e capacidade de raciocínio em longas interações.
Em uma postagem no blog, Demis Hassabis, chefe de IA do Google, destacou as melhorias arquitetônicas que permitem ao Gemini 1.5 Pro igualar o desempenho do modelo maior da empresa, o Gemini 1.0 Ultra, enquanto consome menos recursos computacionais. O Gemini 1.0 Ultra foi apresentado apenas na semana passada.
O avanço mais notável é a introdução de uma janela de contexto de um milhão de tokens, um marco na compreensão de contextos longos. O modelo padrão do Gemini pode analisar comandos em um contexto de 128.000 tokens. Com a atualização para um milhão de tokens, o Gemini 1.5 pode processar um volume muito maior de informações contínuas antes de gerar uma resposta.
Essa janela de um milhão de tokens capacita o raciocínio em longas interações. O CEO do Google, Sundar Pichai, demonstrou as capacidades do Gemini 1.5, ilustrando sua habilidade de resumir a transcrição completa da missão Apollo 11 ou analisar um filme mudo de 44 minutos com Buster Keaton.
Hassabis explicou que o contexto ampliado permite ao Gemini 1.5 analisar, classificar e resumir conteúdos substanciais de maneira integrada. Resultados iniciais indicam que o desempenho se mantém forte, mesmo com o contexto expandido.
Atualmente, a disponibilidade pública da versão de um milhão de tokens é incerta. O Google está oferecendo uma prévia limitada para desenvolvedores e usuários corporativos selecionados através de sua plataforma Vertex AI.
Esse lançamento segue o recente rebranding da IA conversacional do Google, que passou de Bard para Gemini, junto com a criação de uma camada paga Gemini Advanced, utilizando o modelo Ultra 1.0. O Gemini se posiciona como concorrente do ChatGPT Plus da OpenAI.
Hassabis observou que as melhorias em eficiência do Gemini 1.5 permitirão que as equipes do Google "iterem, treinem e entreguem versões avançadas do Gemini mais rapidamente do que nunca." Pichai enfatizou o compromisso do Google em desenvolver o Gemini de forma responsável, respeitando seus princípios de IA. A empresa conduziu testes extensivos de ética e segurança para o Gemini 1.5, com foco em segurança de conteúdo e representação.
O ritmo do progresso em IA conversacional acelerou significativamente desde o lançamento do ChatGPT no ano passado. Especialistas atribuem isso à redução dos custos de treinamento e inovações como a arquitetura Sparsely-Gated Mixture-of-Experts do Google, que facilita o desenvolvimento rápido de novas iterações.
Com o Gemini 1.5, o Google busca solidificar sua liderança no setor de IA. A questão crucial agora é quando essas avançadas capacidades de raciocínio em longos contextos serão integradas nos produtos de consumo do Google.