Google está mejorando activamente su serie Gemini a medida que se acerca el lanzamiento de la versión 2.0. Hoy, la compañía presentó dos nuevas iteraciones: el Gemini 1.5 Flash-8B, una variante más pequeña del Gemini 1.5, y las versiones actualizadas del Gemini 1.5 Flash y Gemini 1.5 Pro. Según Google, estos modelos destacan por sus notables mejoras en varios benchmarks internos, con un impulso significativo en el rendimiento del 1.5 Flash y capacidades mejoradas en matemáticas, programación y solicitudes complejas para el 1.5 Pro.
"El Gemini 1.5 Flash es actualmente la mejor opción para desarrolladores a nivel mundial", declaró Logan Kilpatrick, líder de producto en Google AI Studio, en una publicación en X.
Últimas Iteraciones Experimentales de los Modelos Gemini
Lanzado en mayo, el Gemini 1.5 Flash está diseñado para gestionar contextos largos y puede analizar información detallada de más de 10 millones de tokens. Esto le permite manejar entradas multimodales de alto volumen, incluyendo documentos, video y audio. La nueva variante de 8 mil millones de parámetros del Gemini 1.5 Flash ofrece una experiencia mejorada, mientras que el Gemini 1.5 Pro actualizado optimiza el rendimiento en programación y tareas complejas, sirviendo como un reemplazo directo de su modelo anterior lanzado en agosto.
Kilpatrick mencionó que se espera una versión lista para producción en las próximas semanas, la cual probablemente incluirá características de evaluación. Subrayó que estos modelos experimentales son fundamentales para recopilar comentarios de los desarrolladores y facilitar actualizaciones rápidas.
Las últimas iteraciones del Gemini 1.5 Flash y Pro tienen un límite de 1 millón de tokens y están disponibles para pruebas gratuitas a través de Google AI Studio y la API de Gemini, con planes de incluirlas en el punto de acceso experimental de Vertex AI. Se ofrecerá un nivel gratuito, anticipando una versión de producción en breve.
A partir del 3 de septiembre, Google redirigirá automáticamente las solicitudes al nuevo modelo, eliminando la versión anterior de Google AI Studio y la API para reducir confusiones. "Estamos ansiosos por escuchar tus opiniones y ver cómo este modelo podría habilitar nuevos casos de uso multimodal", compartió Kilpatrick en X.
La Escala Sin Precedentes de Gemini 1.5
Los investigadores de Google DeepMind describen la escala de Gemini 1.5 como "sin precedentes" entre los modelos de lenguaje contemporáneos. Kilpatrick agradeció la entusiasmo de la comunidad hacia el modelo experimental inicial lanzado a principios de este mes, resaltando el arduo trabajo que se dedicó a hacer realidad estas innovaciones.
Comentarios Mixtos sobre las Actualizaciones Recientes
Los comentarios iniciales de la comunidad han sido variados, desde alabanzas entusiastas hasta escepticismo. En una reciente actualización del cuadro de líderes por la Large Model Systems Organization (LMSO), el Gemini 1.5 Flash saltó del puesto 23 al 6 basado en 20,000 votos comunitarios, demostrando su competitividad con modelos como Llama y superando algunas de las ofertas anteriores de Google.
Si bien algunos usuarios señalaron "mejoras sólidas", especialmente en el análisis de imágenes, también surgieron críticas. Algunos cuestionaron la frecuencia de actualizaciones, abogando por una versión más sustancial como el Gemini 2.0. Otros describieron el nuevo lanzamiento como afectado por una "enfermedad de programación perezosa", similar a problemas reportados con GPT-4 Turbo, afirmando que tiene dificultades con salidas más extensas y coherencia.
También surgieron comentarios sobre las elecciones de nombres de Google, con usuarios cuestionando humorísticamente la creatividad de los nombres de los modelos. La discusión en torno a los modelos Gemini continúa evolucionando, reflejando las complejidades de los avances en IA y las expectativas de los usuarios.