A Google está aprimorando ativamente sua série Gemini enquanto se aproxima do lançamento da versão 2.0. Hoje, a empresa apresentou duas novas iterações: o Gemini 1.5 Flash-8B, uma variante menor do Gemini 1.5, e versões atualizadas do Gemini 1.5 Flash e do Gemini 1.5 Pro. De acordo com a Google, esses modelos mostraram melhorias significativas em diversos benchmarks internos, com aumentos de desempenho notáveis para o 1.5 Flash e capacidades aprimoradas em matemática, codificação e prompts complexos para o 1.5 Pro. "O Gemini 1.5 Flash é atualmente a melhor opção para desenvolvedores em todo o mundo", afirmou Logan Kilpatrick, líder de produto do Google AI Studio, em um post no X.
Últimas Iterações Experimentais dos Modelos Gemini
Lançado em maio, o Gemini 1.5 Flash foi projetado para gerenciar longos contextos e pode analisar informações detalhadas de mais de 10 milhões de tokens. Isso permite que ele lidere entradas multimodais de grande volume, incluindo documentos, vídeos e áudios. A nova variante de 8 bilhões de parâmetros do Gemini 1.5 Flash oferece uma experiência aprimorada, enquanto o Gemini 1.5 Pro atualizado melhora o desempenho em codificação e tarefas complexas, servindo como um substituto direto para o modelo anterior, lançado em agosto.
Kilpatrick mencionou que uma versão pronta para produção é esperada nas próximas semanas, provavelmente com recursos de avaliação. Ele enfatizou que esses modelos experimentais são essenciais para coletar feedback dos desenvolvedores e facilitar atualizações rápidas. As últimas iterações do Gemini 1.5 Flash e Pro vêm com um limite de 1 milhão de tokens e estão disponíveis para testes gratuitos através do Google AI Studio e da API do Gemini, com planos para incluí-los no ponto experimental do Vertex AI. Uma camada gratuita será oferecida, e uma versão de produção futura é antecipada em breve.
A partir de 3 de setembro, a Google redirecionará automaticamente as solicitações para o novo modelo, retirando a versão anterior do Google AI Studio e da API para reduzir confusões. "Estamos ansiosos para ouvir suas opiniões e ver como esse modelo pode possibilitar novos casos de uso multimodal", compartilhou Kilpatrick no X.
Escala Sem Precedentes do Gemini 1.5
Pesquisadores da Google DeepMind descrevem a escala do Gemini 1.5 como "sem precedentes" entre os modelos de linguagem contemporâneos. Kilpatrick expressou gratidão pelo entusiasmo da comunidade em relação ao modelo experimental inicial lançado no início deste mês, ressaltando o trabalho árduo envolvido para trazer essas inovações à realidade.
Feedback Misto sobre as Atualizações Recentes
O feedback inicial da comunidade variou, desde elogios entusiasmados até ceticismo. Em uma atualização recente de classificação da Large Model Systems Organization (LMSO), o Gemini 1.5 Flash saltou da 23ª para a 6ª posição, com base em 20.000 votos da comunidade, demonstrando sua competitividade com modelos como Llama e superando algumas das ofertas anteriores da Google.
Embora alguns usuários tenham destacado "melhoras sólidas", especialmente na análise de imagens, críticas também surgiram. Alguns questionaram a frequência das atualizações, defendendo uma versão mais robusta como o Gemini 2.0. Outros descreveram o novo lançamento como afetado pela "síndrome de codificação preguiçosa", semelhante a problemas relatados com o GPT-4 Turbo, alegando que ele tem dificuldades com saídas mais longas e coerência.
Comentários sobre as escolhas de nomes da Google também apareceram, com usuários questionando de forma humorística a criatividade dos nomes dos modelos. O debate em torno dos modelos Gemini continua a evoluir, refletindo as complexidades dos avanços em IA e as expectativas dos usuários.