Google Bard mejora la generación de imágenes y lanza Gemini Pro avanzado para competir con ChatGPT.

Home Noticias de IA Google Bard mejora la generación de imágenes y lanza Gemini Pro avanzado para competir con ChatGPT.

Google está mejorando su chatbot de inteligencia artificial Bard para fortalecer su competitividad frente a ChatGPT de OpenAI. Bajo la dirección de Sundar Pichai, Google ha anunciado la incorporación de capacidades de generación de imágenes a través de su propio modelo de IA, Imagen 2, junto con una versión más avanzada de Gemini Pro. Estas actualizaciones brindan a los usuarios un acceso más amplio a las funcionalidades de IA de Bard, incluyendo una nueva herramienta gratuita para crear imágenes generadas por IA.

“Estas mejoras posicionan a Bard como un socio de IA más eficiente y accesible a nivel global para tareas que van desde grandes proyectos creativos hasta actividades cotidianas”, comentó Jack Krawczyk, líder de producto de Bard, en un blog. Además, Google está probando otro generador de imágenes llamado ImageFX, que comienza a estar disponible hoy.

Gemini Pro con Soporte Multilingüe

Hace más de un mes, Google presentó el modelo de IA Gemini en tres versiones: Nano para uso móvil, Pro para aplicaciones intermedias y Ultra, que se espera que sea el modelo de lenguaje más potente jamás creado, superando a GPT-4. Sin embargo, el lanzamiento de la versión Ultra está previsto para más adelante este año. Comparaciones iniciales entre Gemini Pro y otros modelos indicaron que podría quedarse atrás respecto a GPT-3.5 Turbo de OpenAI, lo que representa un desafío para Google en su objetivo de destacar en el competitivo panorama de la IA generativa. Se lanzó una versión ajustada de Gemini Pro en Bard el mes pasado, aunque solo estaba disponible en inglés.

La serie de nuevas funcionalidades de IA de hoy busca cerrar esta brecha. La última versión de Bard soportará más de 40 idiomas, incluyendo coreano, español, tamil, italiano y ruso, en más de 230 países y territorios. Esta expansión permite a más usuarios acceder a las avanzadas capacidades de Gemini Pro en comprensión, resumido, razonamiento y programación, junto con la función de Bard que verifica respuestas buscando en la web.

Imagen 2 en Bard: Compitiendo con ChatGPT Plus y DALL-E 3

Quizás el desarrollo más emocionante es la introducción de la generación de imágenes con IA utilizando el modelo Imagen 2, diseñado para crear imágenes fotorealistas de alta calidad a partir de descripciones de texto. Esto posiciona a Bard como competidor directo de ChatGPT Plus de OpenAI, que incorpora el generador de imágenes DALL-E 3.

“Simplemente describe lo que deseas—como ‘crear una imagen de un perro montando una tabla de surf’—y Bard generará una variedad de visuales para dar vida a tu concepto,” explicó Krawczyk. Durante las pruebas, Bard produjo imágenes en aproximadamente 30-40 segundos, mostrando buena consistencia. Sin embargo, hubo ocasiones en que no logró generar imágenes, incluso al seguir las directrices que filtran imágenes de personas conocidas para evitar posibles escándalos. Actualmente, no hay soporte para alterar la relación de aspecto o usar indicaciones en idiomas distintos al inglés, según nuestras pruebas iniciales de la herramienta.

Para abordar preocupaciones sobre derechos de autor relacionadas con medios generados por IA, Google Bard permite a los usuarios reportar problemas legales relacionados con la protección de datos y derechos de autor para todo el contenido generado. La plataforma también impone límites en contenido violento, ofensivo o sexualmente explícito. Además, Google ha integrado marcas de agua digitalmente identificables en los píxeles de las imágenes generadas utilizando SynthID, desarrollado por DeepMind, ayudando a diferenciar los visuales generados por IA de aquellos creados por artistas humanos.

Nuevas Funcionalidades con ImageFX

Además de Bard, Google está explorando ImageFX, impulsado por Imagen 2. Disponible ahora en AI Test Kitchen, la aplicación experimental de Google, ImageFX fomenta la exploración creativa a través de “chips expresivos” que proporcionan sugerencias y dimensiones adicionales para mejorar las indicaciones de los usuarios. Esta característica es similar a las ofertas que se encuentran en otras herramientas creativas, como Ideogram.

AI Test Kitchen también alberga proyectos innovadores como MusicFX, que puede crear melodías de hasta 70 segundos con indicaciones de texto y chips expresivos, junto con TextFX, dirigido a letristas y escritores creativos.

Conoce al profesor de UC Berkeley que analiza los deepfakes electorales: Luchando contra la desinformación en la era digital actual.

El Instituto Allen para la IA presenta un LLM 'Verdaderamente de Código Abierto' para impulsar un 'Cambio Crítico' en el Desarrollo de la IA.

Most people like

Question AI

106.5K

Presentamos nuestro asistente de tareas con IA, diseñado para ofrecerte soluciones precisas y orientación para todas tus necesidades académicas. Ya sea que enfrentes problemas matemáticos complejos, escribas ensayos o realices investigaciones, nuestra herramienta inteligente mejorará tu experiencia de aprendizaje al proporcionarte respuestas exactas y confiables. ¡Desbloquea tu potencial académico hoy mismo!

Ayuda con Tareas de IA Homework Helper

PDFToQuiz

46.4K

Transforma PDFs en Cuestionarios Interactivos: Aumenta el Compromiso y el Aprendizaje ¿Buscas una forma dinámica de mejorar el aprendizaje y la retención? Descubre cómo convertir tus documentos PDF en cuestionarios interactivos que cautiven a tu audiencia y generen mejores resultados. En esta guía, exploraremos estrategias y herramientas efectivas para transformar contenido estático en cuestionarios atractivos, haciendo que el aprendizaje sea agradable e impactante. Ya sea para educación, capacitación o evaluaciones, este enfoque puede elevar tu contenido PDF a nuevas alturas. ¡Sumérgete!

Conversión de PDF AI PDF

lipsyncer.ai

17K

Presentamos una plataforma innovadora diseñada para crear videos de sincronización labial generados por IA que cautivan. Optimiza tu proceso de creación de contenido y conecta con tu audiencia como nunca antes gracias a nuestras herramientas y tecnología intuitivas. Ya seas creador de contenido, comercializador o simplemente quieras divertirte, nuestra plataforma te permite producir videos de sincronización labial de alta calidad sin esfuerzo. ¡Sumérgete y desata tu creatividad hoy mismo!

Videos de sincronización labial AI Lip Sync Generator

Mathos AI

Mathos AI: solucionador matemático de IA con soporte de aprendizaje paso a paso.

calculadora matemática Homework Helper

Find AI tools in YBX