OpenAI a officiellement lancé DALL-E 3, la dernière avancée de sa technologie de génération d'images. Cette nouvelle version s'intègre parfaitement à ChatGPT, permettant aux utilisateurs de créer des images directement dans le chatbot. En rédigeant des requêtes en langage naturel, les utilisateurs peuvent demander des images sans quitter leur conversation. De plus, si l'image initiale ne correspond pas tout à fait, ils peuvent communiquer des ajustements à ChatGPT de manière conversationnelle, permettant des améliorations continues jusqu'à obtenir l'image souhaitée.
Rédiger le prompt parfait peut être un défi, mais DALL-E 3 vise à simplifier ce processus. Disponible initialement pour les abonnés ChatGPT Plus moyennant un abonnement mensuel de 20 $, et pour les utilisateurs de ChatGPT Enterprise à partir d'octobre, DALL-E 3 est actuellement en phase de préversion de recherche. Son accès sera élargi via l'API d'OpenAI plus tard cet automne.
Considérée comme une avancée majeure par rapport à DALL-E 2, DALL-E 3 présente une capacité améliorée à générer des images qui correspondent de près au texte fourni par l'utilisateur. OpenAI souligne que ce nouveau modèle comprend un plus grand degré de nuances et de détails, garantissant des résultats de haute qualité. Notamment, les utilisateurs conservent la propriété des images qu'ils créent, qui peuvent être réimprimées, vendues et utilisées à des fins commerciales.
Dans une démarche essentielle pour améliorer la sécurité des utilisateurs, OpenAI a mis en place de nouveaux protocoles. Alors que DALL-E 2 permettait de demander des images dans le style d'artistes spécifiques, DALL-E 3 évite désormais de générer des œuvres imitant le style d'artistes vivants, protégeant ainsi les droits de propriété intellectuelle—une grande préoccupation suite à des actions légales contre des plateformes similaires pour violation présumée.
De plus, DALL-E 3 rejettera les prompts évoquant des personnages publics par leur nom, une décision visant à limiter les risques d'abus dans des campagnes de propagande et de désinformation. Une étude réalisée en juillet a révélé que DALL-E 2 acceptait des requêtes liées à la désinformation autour d'événements tels que les « élections volées ».
OpenAI explore également des méthodes innovantes pour identifier les images générées par l'IA. Une de ces initiatives consiste en un classificateur de provenance, un outil interne conçu pour déterminer si une image a été générée par DALL-E 3. Bien que les détails spécifiques concernant cet outil restent limités, d'autres mises à jour d'OpenAI sont attendues.
De plus, les créateurs ont désormais la possibilité d'empêcher que leurs images soient utilisées dans la formation de futurs modèles d'OpenAI. Pour exercer cette option, ils peuvent remplir un simple formulaire en ligne, leur donnant ainsi un meilleur contrôle sur leurs créations.
Dans l'ensemble, DALL-E 3 représente une évolution remarquable dans la technologie de génération d'images, en plaçant les retours des utilisateurs au cœur de son développement, en améliorant les fonctionnalités de sécurité et en protégeant les droits des artistes et créateurs. Ce modèle innovant est destiné à redéfinir le paysage de la génération d'art numérique.