Google está mejorando su chatbot de inteligencia artificial Bard para fortalecer su competitividad frente a ChatGPT de OpenAI. Bajo la dirección de Sundar Pichai, Google ha anunciado la incorporación de capacidades de generación de imágenes a través de su propio modelo de IA, Imagen 2, junto con una versión más avanzada de Gemini Pro. Estas actualizaciones brindan a los usuarios un acceso más amplio a las funcionalidades de IA de Bard, incluyendo una nueva herramienta gratuita para crear imágenes generadas por IA.
“Estas mejoras posicionan a Bard como un socio de IA más eficiente y accesible a nivel global para tareas que van desde grandes proyectos creativos hasta actividades cotidianas”, comentó Jack Krawczyk, líder de producto de Bard, en un blog. Además, Google está probando otro generador de imágenes llamado ImageFX, que comienza a estar disponible hoy.
Gemini Pro con Soporte Multilingüe
Hace más de un mes, Google presentó el modelo de IA Gemini en tres versiones: Nano para uso móvil, Pro para aplicaciones intermedias y Ultra, que se espera que sea el modelo de lenguaje más potente jamás creado, superando a GPT-4. Sin embargo, el lanzamiento de la versión Ultra está previsto para más adelante este año. Comparaciones iniciales entre Gemini Pro y otros modelos indicaron que podría quedarse atrás respecto a GPT-3.5 Turbo de OpenAI, lo que representa un desafío para Google en su objetivo de destacar en el competitivo panorama de la IA generativa. Se lanzó una versión ajustada de Gemini Pro en Bard el mes pasado, aunque solo estaba disponible en inglés.
La serie de nuevas funcionalidades de IA de hoy busca cerrar esta brecha. La última versión de Bard soportará más de 40 idiomas, incluyendo coreano, español, tamil, italiano y ruso, en más de 230 países y territorios. Esta expansión permite a más usuarios acceder a las avanzadas capacidades de Gemini Pro en comprensión, resumido, razonamiento y programación, junto con la función de Bard que verifica respuestas buscando en la web.
Imagen 2 en Bard: Compitiendo con ChatGPT Plus y DALL-E 3
Quizás el desarrollo más emocionante es la introducción de la generación de imágenes con IA utilizando el modelo Imagen 2, diseñado para crear imágenes fotorealistas de alta calidad a partir de descripciones de texto. Esto posiciona a Bard como competidor directo de ChatGPT Plus de OpenAI, que incorpora el generador de imágenes DALL-E 3.
“Simplemente describe lo que deseas—como ‘crear una imagen de un perro montando una tabla de surf’—y Bard generará una variedad de visuales para dar vida a tu concepto,” explicó Krawczyk. Durante las pruebas, Bard produjo imágenes en aproximadamente 30-40 segundos, mostrando buena consistencia. Sin embargo, hubo ocasiones en que no logró generar imágenes, incluso al seguir las directrices que filtran imágenes de personas conocidas para evitar posibles escándalos. Actualmente, no hay soporte para alterar la relación de aspecto o usar indicaciones en idiomas distintos al inglés, según nuestras pruebas iniciales de la herramienta.
Para abordar preocupaciones sobre derechos de autor relacionadas con medios generados por IA, Google Bard permite a los usuarios reportar problemas legales relacionados con la protección de datos y derechos de autor para todo el contenido generado. La plataforma también impone límites en contenido violento, ofensivo o sexualmente explícito. Además, Google ha integrado marcas de agua digitalmente identificables en los píxeles de las imágenes generadas utilizando SynthID, desarrollado por DeepMind, ayudando a diferenciar los visuales generados por IA de aquellos creados por artistas humanos.
Nuevas Funcionalidades con ImageFX
Además de Bard, Google está explorando ImageFX, impulsado por Imagen 2. Disponible ahora en AI Test Kitchen, la aplicación experimental de Google, ImageFX fomenta la exploración creativa a través de “chips expresivos” que proporcionan sugerencias y dimensiones adicionales para mejorar las indicaciones de los usuarios. Esta característica es similar a las ofertas que se encuentran en otras herramientas creativas, como Ideogram.
AI Test Kitchen también alberga proyectos innovadores como MusicFX, que puede crear melodías de hasta 70 segundos con indicaciones de texto y chips expresivos, junto con TextFX, dirigido a letristas y escritores creativos.