Hemos estado presenciando la evolución de las imágenes generadas por inteligencia artificial durante algún tiempo, pero recientemente, las empresas líderes en el campo han dado avances significativos. Esta semana, actualizaciones notables de Midjourney, el último modelo de Google y Grok han acaparado la atención.
Cada una de estas compañías está ampliando los límites de la tecnología de IA a ritmos diferentes y en direcciones únicas. Con un panorama abierto y competitivo, es fascinante observar cuánto progreso se ha logrado.
Midjourney se Expande con un Nuevo Editor Web
Midjourney ha lanzado un nuevo editor web que reúne diversas herramientas de manipulación de imágenes en una interfaz única y fácil de usar. Anteriormente, los usuarios tenían que navegar por múltiples menús para funciones como el reencuadre, la modificación de imágenes existentes, el paneo, la extensión de lienzo y el zoom. Esta nueva interfaz simplificada mejora significativamente la experiencia de edición, marcando un cambio de su operación original en Discord.
Según el CEO de Midjourney, David Holz, el objetivo es hacer que la edición de imágenes generadas por IA sea "mucho más fluida". A medida que la plataforma continúa su transición de Discord a una aplicación web, sincronizará también la actividad de canales populares como “daily-theme”, “prompt-craft” y “general-1” entre Discord y sus salas web. Además, se ha añadido una nueva herramienta de selección de pinceles digitales para reemplazar las herramientas de selección tradicionales, facilitando el proceso de edición para los usuarios que han creado más de diez imágenes en la plataforma. Los primeros comentarios de la comunidad creativa han sido abrumadoramente positivos. Esta actualización sigue al lanzamiento de Midjourney 6.1, que mejoró notablemente la calidad de las imágenes, la coherencia (incluyendo una mejor precisión en los detalles de las manos) y la velocidad de procesamiento.
Lanzamiento Controversial de Grok-2
Solo dos días después de la actualización de Midjourney, Grok-2 fue presentado por la startup xAI de Elon Musk, marcando otro desarrollo importante en la generación de imágenes por IA. Impulsado por el modelo Flux.1 de Black Forrest Lab, Grok-2 está ganando popularidad por su impresionante calidad de imagen y accesibilidad.
Sin embargo, las directrices de Grok-2 generan preocupaciones. A diferencia de otros generadores de IA, parece tener políticas mínimas respecto a la propiedad intelectual, la violencia y el contenido explícito. Esta falta de límites claros ha desatado controversia, con usuarios creando imágenes perturbadoras y poco convencionales que recuerdan a los primeros días de las imágenes generadas por IA. Musk ha descrito a Grok-2 como “la IA más divertida del mundo”, sugiriendo que esta flexibilidad podría ser una elección deliberada, influyendo potencialmente en la trayectoria futura de la tecnología de IA.
Google Lanza Imagen 3 para Competir
Finalmente, Google ha presentado su modelo de IA Imagen 3, afirmando que es su “modelo de texto a imagen de la más alta calidad” hasta la fecha. Lanzado para usuarios en EE. UU., Imagen 3 promete mayor detalle, mejor iluminación y menos artefactos distractores en comparación con sus predecesores. El modelo es particularmente efectivo en la representación de texto y viene en varias versiones, adaptándose a diferentes necesidades, desde bocetos rápidos hasta imágenes de alta resolución. Actualmente, Imagen 3 está disponible a través de la AI Test Kitchen de Google como parte de ImageFX, aunque permanece en beta cerrada, lo que requiere que los usuarios se inscriban en una lista de espera para participar.