Ideogram améliore son générateur d'images AI grâce à un référencement basé sur les descriptions pour des résultats optimisés.

Un peu plus d'un mois après le lancement de son modèle avancé de génération d'images à partir de texte, Ideogram propose une mise à jour introduisant plusieurs nouvelles fonctionnalités, notamment le référencement basé sur des descriptions et l'invitation négative (negative prompting).

Ces améliorations, disponibles sur la plateforme web d'Ideogram, visent à offrir aux utilisateurs un meilleur contrôle sur la création d'images tout en améliorant la qualité et la cohérence des résultats. Cette mise à jour constitue une avancée significative pour rivaliser avec des acteurs établis dans le domaine de la génération d'images, tels que Midjourney et DALL-E.

Quoi de Neuf sur Ideogram ?

Avec le lancement initial de la version 1.0 en février, les utilisateurs ont eu accès à une fonctionnalité de "magic prompt" qui enrichissait leur saisie. S'appuyant sur cette base, Ideogram présente maintenant une nouvelle capacité de description qui génère des légendes à partir d'images de référence. Les utilisateurs peuvent télécharger une image publique générée par Ideogram ou leur propre image, et l'IA produira une description textuelle. Cette description peut ensuite être raffinée pour créer une image similaire adaptée à des besoins spécifiques.

De plus, Ideogram déploie l'invitation négative, permettant aux utilisateurs d'indiquer ce qu'ils ne souhaitent pas dans leurs résultats. Cette fonctionnalité aide à éliminer certains objets ou styles de la génération finale.

Les utilisateurs peuvent également choisir entre les modes Rapide, Par défaut, ou Qualité pour la génération des images. Le mode Rapide produit des images basiques en environ cinq secondes, tandis que le mode Qualité privilégie le photoréalisme sur une durée d'environ vingt secondes. Le mode Par défaut offre un équilibre, générant des images en environ douze secondes. Bien que l'adoption de ces modes par les utilisateurs reste à voir, Ideogram encourage leur utilisation pour générer une image basique rapidement, puis la raffiner pour des résultats de meilleure qualité.

Amélioration du Photoréalisme et du Rendu de Texte

Ideogram améliore également ses capacités de rendu de texte, avec une réduction des taux d'erreurs de 15 %. Bien que ce changement puisse sembler modeste, l'entreprise affirme que son modèle surpasse DALL-3 Vivid en matière de génération de caractères et de mots.

Bien qu'aucune statistique comparant le modèle mis à jour avec Midjourney n'ait été divulguée, Ideogram soutient que la dernière version offre une meilleure cohérence d'image et un photoréalisme accru, les évaluateurs humains la préférant de 30 à 50 % par rapport à son prédécesseur en alignement des indications, cohérence d'image et qualité de rendu textuel. Depuis le lancement de la version bêta publique l'année dernière, Ideogram a attiré plus de sept millions de créateurs.

Actuellement, l'invitation négative et les modes de vitesse sont exclusifs aux utilisateurs des plans Basic et Plus d'Ideogram. La disponibilité de la fonctionnalité de légendage d'image de référence reste incertaine, bien qu'elle puisse être gratuite, semblable à la fonctionnalité Remix. Les améliorations en matière de cohérence du texte et de l'image sont accessibles à tous les utilisateurs.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles