Google Presenta Herramientas Mejoradas de IA Generativa: Imagen 3 y Gems
Google está mejorando sus herramientas de IA generativa, comenzando esta semana con el lanzamiento de Imagen 3, la versión de próxima generación de su generador de imágenes. Esta actualización restablece la capacidad de generar imágenes de personas, un aspecto que había sido eliminado anteriormente por controversias. Además, el nuevo chatbot Gemini ahora incluye "Gems", una función que permite a los usuarios crear bots personalizados con instrucciones específicas, similar a los GPTs personalizados de ChatGPT.
Imagen 3: Generación de Imágenes Avanzada
Imagen 3 está diseñada para establecer un nuevo estándar en calidad de imagen, con medidas de seguridad incorporadas para evitar problemas de diversidad que afectaron versiones anteriores. Según Dave Citron, Gerente de Producto de Gemini, “Imagen 3 se desempeña favorablemente en una amplia gama de benchmarks en comparación con otros modelos de generación de imágenes.” La herramienta actualizada permite a los usuarios guiar la creación de imágenes con indicaciones adicionales si el resultado inicial no satisface sus expectativas.
El nuevo modelo también integra la tecnología SynthID de Google para marcar las imágenes, identificándolas claramente como generadas por IA, evitando confusiones con fotografías reales. Citron indicó que la capacidad de generar imágenes de personas estará disponible pronto para usuarios de pago, con salvaguardias para prohibir la creación de “individuos identificables fotorrealistas” y de imágenes que incluyan niños o contenido gráfico, violento o sexual. Aunque reconoció que las imágenes de Gemini pueden no ser perfectas, aseguró a los usuarios que la empresa seguirá perfeccionando el modelo basado en sus comentarios.
Presentando Gems: Chatbots Personalizados para Mayor Funcionalidad
Gems, presentados inicialmente en Google I/O 2024, permiten a los usuarios crear chatbots personalizados para tareas específicas. Esta característica ofrece una solución a quienes necesiten ayuda con proyectos, sesiones de lluvia de ideas o incluso al redactar subtítulos para redes sociales. Citron enfatizó, “Tu Gem puede recordar un conjunto detallado de instrucciones para ayudarte a ahorrar tiempo en tareas tediosas, repetitivas o desafiantes.”
Para fomentar la participación del usuario, Gemini también ofrecerá Gems preconstruidos diseñados para inspirar la creatividad y agilizar procesos de trabajo. Algunos de los Gems disponibles incluyen:
- Coach de Aprendizaje: Ayuda a comprender temas complejos.
- Generador de Ideas: Estimula nuevas ideas para proyectos.
- Guía Profesional: Asiste en la mejora de habilidades y decisiones laborales.
- Editor de Escritura: Proporciona retroalimentación constructiva sobre gramática y estructura.
- Compañero de Programación: Ayuda a los desarrolladores a mejorar sus habilidades de programación e inspirar nuevos proyectos.
Gems se lanzan hoy para escritorio y móvil, pero actualmente solo están accesibles para suscriptores de Gemini Advanced, Business y Enterprise. Para utilizar estas innovadoras funciones, los usuarios deberán optar por un plan de pago.
Al mejorar sus capacidades de IA, Google busca ofrecer herramientas más intuitivas y efectivas, respondiendo a la creciente demanda de tecnologías generativas sofisticadas.