O Google apresentou oficialmente o seu modelo de linguagem de próxima geração, Gemini, que promete ser o maior e "mais capaz" que a empresa já desenvolveu. Após um longo período de especulação, a empresa publicou um blog detalhando as capacidades do modelo, que está disponível em três variações: Ultra, Pro e Nano. Essa versatilidade permite que o Gemini funcione efetivamente em dispositivos móveis e em grandes centros de dados.
A partir de hoje, o Gemini começará a alimentar diversas soluções, incluindo o chatbot Bard, que inicialmente utilizará o modelo Gemini Pro e estará disponível em inglês. O Google afirma que isso aprimorará significativamente as habilidades de raciocínio e compreensão do Bard. O plano é lançar o Bard Avançado em início de 2024, embora detalhes sobre essa nova versão ainda sejam escassos. No entanto, foi mencionado que o acesso aos "modelos e capacidades avançadas" começará com o Gemini Ultra.
O novo Pixel 8 Pro será o primeiro smartphone capaz de rodar o Gemini Nano. No próximo ano, os usuários terão acesso a recursos novos e empolgantes, como a função Resumir no aplicativo Gravador e uma prévia para desenvolvedores da Resposta Inteligente no Gboard, inicialmente disponível para WhatsApp. Além disso, o Gemini será integrado ao Google Ads, Chrome e Duet AI, com mais recursos sendo adicionados em sua variada linha de produtos. O Google também destacou que vem refinando o desempenho do modelo em buscas, oferecendo melhorias à Experiência Generativa de Busca (SGE).
Embora o post do blog não tenha mencionado a integração com os recursos do Makersuite, um vazamento anterior sugeriu que a plataforma de desenvolvimento web do Google utilizaria as capacidades generativas do Gemini. Apresentado inicialmente pelo CEO do Google, Sundar Pichai, no evento I/O 2023, o Gemini busca estabelecer uma presença competitiva no rapidamente evolutivo cenário de IA.
A partir de 13 de dezembro, desenvolvedores e clientes empresariais poderão acessar o Gemini Pro através da API do Gemini no Vertex AI ou no Google AI Studio, a ferramenta gratuita de desenvolvimento da empresa. O Gemini Ultra estará disponível para organizações selecionadas antes da disponibilidade mais ampla para clientes empresariais no início de 2024. Desenvolvedores Android interessados em criar aplicativos impulsionados pelo Gemini podem se inscrever para uma prévia da variante Nano por meio do Android AICore.
O Gemini foi anunciado pela primeira vez durante um evento corporativo em maio, mas permaneceu em grande parte em sigilo desde então. Como um modelo de fronteira avançado, prioriza avanços fundamentais em modelos de linguagem, um tema de grande foco na recente Cúpula de Segurança de IA. Embora o Google tenha planejado apresentar o modelo em eventos privados nesta semana, essas demonstrações foram canceladas devido a desafios na manipulação de consultas em idiomas que não são o inglês. No entanto, apresentações privadas ainda foram realizadas para parceiros comerciais não nomeados.
Internamente, a alta liderança do Google expressa um forte desejo de que o Gemini rivalize com o ChatGPT da OpenAI, enfatizando a urgência de um lançamento antecipado para manter a vantagem competitiva. Além disso, com o AI Copilot da Microsoft fazendo avanços significativos em softwares de produtividade que integram várias tecnologias da OpenAI, o Google está motivado a acelerar sua inovação.
Em termos de avanços em hardware, o Google treinou o Gemini em seus chips TPU proprietários. Junto ao lançamento do modelo, novos aceleradores de IA conhecidos como Cloud TPU v5p foram anunciados. Esses chips mais recentes oferecem uma velocidade de treinamento 2,8 vezes maior em modelos de linguagem em comparação com a geração anterior de TPU v4 e são relatados como mais poderosos do que os já disponíveis Cloud TPU v5e.
O Google Cloud também revelou seu AI Hypercomputer, uma arquitetura de supercomputador inovadora projetada especificamente para aprimorar o treinamento e a otimização da IA. Essa infraestrutura avançada atende à crescente demanda computacional das aplicações de IA generativa, oferecendo um sistema integrado de hardware, software, estruturas de aprendizado de máquina e modelos de consumo adaptados à IA.
Para utilizar o Cloud TPU v5p ou acessar o novo AI Hypercomputer, as empresas precisarão entrar em contato com seu gerente de conta designado do Google Cloud, assegurando que possam aproveitar essas tecnologias de ponta para suas necessidades comerciais.