Faisant une pause dans les critiques des images générées par l'IA racially mixte de Google Gemini, Marc Andreessen et ses collègues de la société de capital-risque Andreessen Horowitz (a16z) ont renforcé leur investissement dans Ideogram, une startup concurrente spécialisée dans la génération d'images. Aujourd'hui, les entreprises ont annoncé qu'a16z dirigeant le financement de série A de 80 millions de dollars d'Ideogram.
De plus, Martin Casado, partenaire général chez a16z, siègera au conseil d'administration d'Ideogram. La startup a également présenté son nouveau modèle de génération d'images, Ideogram 1.0, qui se distingue par un "rendu textuel à la pointe de la technologie, un photoréalisme sans précédent, le respect des instructions et une nouvelle fonctionnalité appelée Magic Prompt," selon un article de blog de l'entreprise.
Ideogram 1.0 est actuellement disponible gratuitement sur le site web de l'entreprise, nécessitant un compte Google ou Apple pour se connecter. Les utilisateurs peuvent également générer des images via le serveur Discord de l'entreprise.
La société propose un niveau gratuit limité à 100 générations d'images par jour, ainsi que des abonnements mensuels : 7 $ pour 400 images quotidiennes (facturées annuellement comme Basique) et 16 $ pour des images quotidiennes illimitées (facturées annuellement comme Plus).
Parmi les investisseurs de la Série A de 80 millions de dollars d'Ideogram figurent Index Ventures, Redpoint Ventures, Pear VC et SV Angel, avec le soutien initial d'a16z et de partenaires précédents tels qu'AIX Ventures et Golden Ventures, ainsi que des experts de l'industrie.
Évolution dans la génération de texte et de typographie
Fondée par d'anciens chercheurs de Google Brain IA, Ideogram a fait la une en août 2023 en proposant du texte et de la typographie intégrés dans des images générées par IA—une capacité que des concurrents comme Midjourney n'avaient pas à l'époque. Cependant, les avancées technologiques ont bouleversé le paysage, avec Midjourney et DALL-E 3 d'OpenAI intégrant également la génération de texte dans leurs dernières versions. En conséquence, la création d'images avec du texte lisible est devenue la norme, réduisant ainsi la position unique d'Ideogram.
Malgré ce changement, Ideogram revendique sa supériorité. Dans son récent article de blog, la société a mis en avant des recherches indiquant que les évaluateurs humains préfèrent ses résultats à ceux de Midjourney V6 et DALL-E 3.
Améliorations et nouvelles fonctionnalités
Lors de son lancement, Ideogram s'est distingué en permettant aux utilisateurs de choisir parmi diverses styles d'images pré-curatés, tels que “rendu 3D, cinématographique, peinture, mode, produit, illustration et ukiyo-e.” La plateforme propose désormais plus d'options, y compris différents rapports d'aspect, poids d'image et paramètres de visibilité, ainsi qu'un commutateur pour la nouvelle fonctionnalité Magic Prompt.
L'outil Magic Prompt améliore les instructions textuelles générées par les utilisateurs, les rendant automatiquement plus descriptives et détaillées pour produire des images de meilleure qualité. Bien que similaire à l'approche d'OpenAI avec DALL-E 3, où l'IA affine les instructions pour de meilleurs résultats, les deux fonctionnalités visent à faciliter la communication entre l'utilisateur et le modèle d'IA.
Ces avancées sont prometteuses pour la communauté artistique AI en plein essor et les potentiels utilisateurs d'entreprise, mais le lancement d'Ideogram 1.0 pourrait également entraîner une augmentation des résultats d'images IA de basse qualité et indésirables, un problème déjà visible sur internet.