Google ha lanzado oficialmente su modelo de inteligencia artificial generativa más avanzado, Gemini, para necesidades de desarrollo de aplicaciones empresariales. Presentado la semana pasada, Gemini está disponible en tres versiones: Ultra, Pro y Nano. El anuncio de hoy hace que la versión Pro esté accesible a través de una API, permitiendo a los desarrolladores usarla de forma gratuita con ciertos límites de uso, como se detalla en una reciente publicación de blog.
Gemini Pro para Desarrolladores: Características Clave
Los desarrolladores pueden acceder a la primera versión de Gemini Pro a través de la API de Google AI Studio, que proporciona una plataforma web para crear prompts y obtener claves API para el desarrollo de aplicaciones. Esta versión ofrece una ventana de contexto de 32K para la generación de texto, con planes de ampliar esta característica en el futuro.
Google también ha introducido un punto de acceso multimodal dedicado, Gemini Pro Vision, que acepta entradas de texto e imágenes, proporcionando salidas de texto. En una publicación en X, el CEO Sundar Pichai destacó las características integrales de la API de Gemini, que incluyen llamadas a funciones, incrustaciones, recuperación semántica, establecimiento de conocimiento personalizado y capacidades de chat. La API es compatible con 38 idiomas en más de 180 países.
Gemini Pro también se integrará en Vertex AI, la plataforma de IA integral de Google Cloud, que incluye herramientas, infraestructura gestionada completamente y características de privacidad y seguridad integradas. Esta integración permite a los desarrolladores realizar la transición a un entorno gestionado según sea necesario.
La empresa busca recopilar comentarios de los desarrolladores para perfeccionar Gemini Pro mientras se prepara para lanzar el más complejo Gemini Ultra el próximo año.
Acceso Gratuito con Limitaciones
Actualmente, Google ofrece Gemini Pro y Gemini Pro Vision de forma gratuita, con un límite de 60 solicitudes por minuto. Esto aplica también a los desarrolladores que utilizan los modelos en Vertex AI, pero este acceso gratuito estará disponible solo hasta que se lance el servicio a gran escala el próximo año. Es notable que la cuota gratuita de Google es 20 veces mayor que las ofertas de sus competidores, lo que la hace adecuada para la mayoría de los proyectos de desarrollo.
Una vez que el servicio esté completamente disponible, se implementarán precios basados en el uso, cobrando por cada 1,000 caracteres o imágenes. Específicamente, el costo de entrada para Gemini Pro se establece en $0.00025 por 1,000 caracteres y $0.0025 por imagen, mientras que la salida permanece en $0.0005 por 1,000 caracteres. Algunos usuarios en X han señalado que el modelo de precios de Google, que cobra por carácter, es significativamente más alto que el de competidores como OpenAI, que generalmente cobra por token, una representación numérica que puede abarcar palabras enteras.
Mejoras en Vertex AI
Junto al lanzamiento de Gemini Pro, Google ha actualizado Vertex AI con su última tecnología de difusión de texto a imagen, Imagen 2. Esta actualización introduce características para generar una amplia gama de logotipos, emblemas y marcas denominativas creativas y realistas, mejorando también los resultados en la representación de texto en múltiples idiomas.
Además, Google anunció la disponibilidad de MedLM, una familia de modelos base ajustados para el sector de la salud, para organizaciones en EE. UU. a través de Vertex AI. Esta nueva oferta se basa en el modelo base Med-PaLM 2 anterior, con una actualización basada en Gemini esperada pronto.