Google s'apprête à lancer une mise à jour impressionnante de son modèle de génération d'images à partir de texte, Imagen 3, promettant des détails améliorés, une compréhension du langage naturel renforcée et un rendu textuel de qualité supérieure. Actuellement disponible pour certains créateurs dans une préversion privée sur ImageFX, les développeurs peuvent s'inscrire sur une liste d'attente pour y accéder. De plus, l'intégration d'Imagen 3 dans Vertex AI est attendue.
« C'est notre modèle de génération d'images le plus avancé à ce jour », a déclaré Douglas Eck, directeur de recherche senior chez Google DeepMind, lors de la conférence des développeurs I/O de l'entreprise. « Imagen 3 offre un photoréalisme accru, des détails plus riches et moins de défauts visuels ou distorsions. Il comprend les requêtes de manière conversationnelle : plus vous fournissez de créativité et de détails, meilleure sera la sortie. Imagen 3 excelle à incorporer des éléments subtils dans des requêtes plus longues et représente notre meilleur effort pour rendre le texte, un défi commun pour les modèles de génération d'images. »
Cette annonce intervient seulement six mois après que Google a rendu Imagen 2 largement accessible sur Vertex AI, suite à son lancement des capacités de texte à vivant en avril. Rester en tête dans le paysage concurrentiel des outils de génération d'images AI — tels que DALL-E d'OpenAI, Midjourney, Firefly d'Adobe, l'AI de Meta et Designer de Microsoft — est crucial pour Google.
Cependant, le parcours de Google dans ce domaine n’a pas été sans défis. Plus tôt cette année, l'entreprise a fait face à des critiques pour ses images générées par IA, qualifiées par certains d’« trop woke ». Cela comprenait des représentations des Pères fondateurs des États-Unis avec un homme noir et des soldats allemands de la Seconde Guerre mondiale aux côtés d'un homme noir et d'une femme asiatique. Google a reconnu cette erreur, le PDG Sundar Pichai affirmant ses excuses lors d'une interview avec Bloomberg.
La révélation d’Imagen 3 fait partie de plusieurs mises à jour passionnantes présentées lors de Google I/O, qui inclut également le lancement d'un nouveau modèle de génération vidéo, Veo.