Google ha lanzado Gemini 1.5, la última versión de su sistema de IA conversacional, que presenta mejoras significativas en eficiencia, rendimiento y capacidades de razonamiento a largo plazo.
En una publicación de blog de Demis Hassabis, jefe de Google AI, se destacaron mejoras arquitectónicas clave que permiten a Gemini 1.5 Pro igualar el rendimiento del modelo más grande de la empresa, Gemini 1.0 Ultra, consumiendo menos recursos computacionales. Gemini 1.0 Ultra fue presentado la semana pasada.
El avance más notable es la introducción de una ventana de contexto de un millón de tokens, un gran avance en la comprensión de contextos largos. El modelo estándar de Gemini puede analizar instrucciones dentro de un contexto de 128,000 tokens. Con la actualización a un millón de tokens, Gemini 1.5 puede procesar un volumen mucho mayor de información continua antes de generar una respuesta.
Este contexto de un millón de tokens potencia el razonamiento a largo plazo. El CEO de Google, Sundar Pichai, mostró las capacidades de Gemini 1.5 al ilustrar su habilidad para resumir la transcripción completa de la misión Apollo 11 o analizar un cortometraje mudo de 44 minutos protagonizado por Buster Keaton.
Hassabis explicó que el contexto ampliado permite a Gemini 1.5 analizar, clasificar y resumir contenido sustancial sin problemas. Los resultados iniciales indican que el rendimiento se mantiene fuerte incluso con el contexto extendido.
Por el momento, la disponibilidad pública de la versión de un millón de tokens es incierta. Google está ofreciendo una vista previa limitada a desarrolladores seleccionados y usuarios empresariales a través de su plataforma Vertex AI.
Este lanzamiento sigue al reciente cambio de marca de Google en su IA conversacional de Bard a Gemini, junto con el lanzamiento de un nivel de pago Gemini Advanced que utiliza el modelo Ultra 1.0. Gemini se posiciona como un competidor de ChatGPT Plus de OpenAI.
Hassabis señaló que las mejoras de eficiencia en Gemini 1.5 permitirán a los equipos de Google "iterar, entrenar y entregar versiones más avanzadas de Gemini más rápido que nunca". Pichai enfatizó el compromiso de Google de desarrollar Gemini de manera responsable, adheriéndose a sus principios de IA. La empresa ha llevado a cabo pruebas exhaustivas de ética y seguridad para Gemini 1.5, enfocándose en la seguridad y representación del contenido.
El ritmo de progreso en la IA conversacional ha acelerado significativamente desde el lanzamiento de ChatGPT el año pasado. Los expertos atribuyen esta aceleración a la reducción de costos de entrenamiento y a innovaciones como la arquitectura de Mixtura de Expertos Escasamente Puesta en Puerta de Google, que facilita el desarrollo rápido de nuevas iteraciones.
Con Gemini 1.5, Google busca consolidar su liderazgo en el sector de la IA. La pregunta urgente es cuándo se integrarán estas avanzadas capacidades de razonamiento a largo plazo en los productos de consumo de Google.