Lanzamiento de la Vista Previa Pública de Google Gemini 1.5 Pro: Explorando Nuevas Funciones de Reconocimiento de Voz

En el reciente evento Google Next, Google anunció una actualización significativa para su modelo de IA, Gemini 1.5 Pro, dotándolo de capacidades de procesamiento de audio sin precedentes. Ahora, Gemini 1.5 Pro puede interpretar y analizar directamente archivos de audio subidos, extrayendo información valiosa de conferencias de resultados o del audio de videos, sin necesidad de transcripciones escritas.

Un aspecto destacado de esta actualización es que Gemini 1.5 Pro ha superado a Gemini Ultra, que era el modelo más potente de la serie, en rendimiento. Google informó que este modelo puede comprender comandos complejos sin requerir ajustes finos, marcando un avance importante en la tecnología de IA.

Es importante señalar que el acceso a Gemini 1.5 Pro está limitado a usuarios con capacidades en Vertex AI y AI Studio. La mayoría de los usuarios interactúan con los modelos de lenguaje de Gemini a través del chatbot de Gemini, mientras que Gemini Ultra respalda chatbots más avanzados. Aunque Gemini Ultra es robusto, no iguala la velocidad de Gemini 1.5 Pro.

Además, Google presentó actualizaciones para otro modelo de IA, Imagen 2. Este avanzado sistema de generación de texto a imagen mejora las capacidades visuales de Gemini, permitiendo a los usuarios añadir o eliminar elementos en las imágenes. Google también introdujo SynthID, una función de marca de agua digital para todas las imágenes creadas con el modelo Imagen, que incrusta una marca invisible para indicar la fuente de las imágenes.

Por otra parte, Google mostró un nuevo método que integra respuestas de IA con Google Search, permitiendo proporcionar respuestas basadas en información en tiempo real. Esto significa que los modelos de lenguaje grandes podrán ofrecer datos actuales en lugar de depender únicamente de información preexistente. Sin embargo, Google ha decidido restringir a Gemini de responder a preguntas relacionadas con las elecciones estadounidenses de 2024, reflejando un compromiso con el manejo responsable de información sensible.

Cabe destacar que Gemini ha recibido críticas por generar imágenes inexactas de figuras históricas, recordándonos que, a pesar de los avances en la tecnología de IA, se requiere precaución al tratar datos históricos y del mundo real.

Most people like

Find AI tools in YBX