Nous avons observé l’évolution des images générées par l’IA depuis quelque temps, mais récemment, les entreprises leaders dans ce domaine ont réalisé des avancées significatives. Cette semaine, des mises à jour notables de Midjourney, du dernier modèle de Google et de Grok ont particulièrement retenu l’attention.
Chacune de ces entreprises repousse les limites de la technologie IA à des rythmes différents et dans des directions uniques. Alors que le paysage reste ouvert et concurrentiel, il est fascinant de constater les progrès accomplis.
Midjourney s’agrandit avec un nouvel éditeur web
Midjourney a récemment lancé un nouvel éditeur web qui regroupe divers outils de manipulation d’image dans une interface conviviale. Auparavant, les utilisateurs devaient naviguer dans plusieurs menus pour des fonctions comme le recadrage, la retouche, le panoramique, l’extension de la toile et le zoom. Cette interface simplifiée améliore considérablement l’expérience d’édition, marquant une transition par rapport à son fonctionnement initial sur Discord.
Selon le PDG de Midjourney, David Holz, l’objectif est de rendre l’édition des images générées par l’IA « beaucoup plus fluide ». Alors que la plateforme continue son passage de Discord à une application web, Midjourney synchronisera également les activités des canaux populaires comme « daily-theme », « prompt-craft » et « general-1 » sur Discord et dans ses salles web. De plus, un nouvel outil de sélection de pinceaux numériques a remplacé les outils de sélection traditionnels, rendant le processus d'édition plus fluide pour les utilisateurs ayant créé plus de dix images sur la plateforme. Les premiers retours de la communauté créatrice sont extrêmement positifs. Cette mise à jour fait suite au lancement de Midjourney 6.1, qui a considérablement amélioré la qualité des images, la cohérence (notamment une meilleure précision pour les détails de mains) et les vitesses de traitement.
Lancement controversé de Grok-2
Deux jours après la mise à jour de Midjourney, Grok-2 a été dévoilé par la startup xAI d’Elon Musk, marquant un autre développement majeur dans la génération d’images par IA. Alimenté par le modèle Flux.1 du Black Forrest Lab, Grok-2 suscite de l’intérêt grâce à sa qualité d’image impressionnante et son accessibilité.
Cependant, les directives de Grok-2 soulèvent des inquiétudes. Contrairement aux autres générateurs d’IA, il semble avoir des politiques minimales concernant la propriété intellectuelle, la violence et le contenu explicite. Ce manque de limites claires a suscité la controverse, des utilisateurs créant des images troublantes et non conventionnelles, rappelant les débuts des visuels générés par l’IA. Musk a décrit Grok-2 comme « l’IA la plus amusante au monde », suggérant que cette approche laxiste pourrait être un choix délibéré, influençant potentiellement l’avenir de la technologie IA.
Google lance Imagen 3 en compétition
Enfin, Google a dévoilé son modèle d’IA Imagen 3, affirmant qu’il s’agit de son « modèle texte-image de la plus haute qualité » à ce jour. Destiné aux utilisateurs américains, Imagen 3 promet des détails améliorés, une meilleure lumière et moins d’artefacts distractifs par rapport à ses prédécesseurs. Le modèle est particulièrement efficace pour rendre le texte et se décline en différentes versions, répondant à des besoins variés, des croquis rapides aux images haute résolution. Actuellement, Imagen 3 est accessible via Google’s AI Test Kitchen dans le cadre d’ImageFX, bien qu’il soit encore en version bêta fermée, nécessitant des utilisateurs de s'inscrire sur une liste d’attente pour y participer.