Google Lance des Outils d'IA Générative Améliorés : Imagen 3 et Gems
Google améliore ses outils d'IA générative avec le lancement d'Imagen 3, la nouvelle version de son générateur d'images. Cette mise à jour réintroduit la fonctionnalité de génération d'images de personnes, auparavant retirée, répondant ainsi aux controverses passées. De plus, le nouveau chatbot Gemini inclut désormais les "Gems", une fonction permettant de créer des bots personnalisés avec des instructions sur mesure, semblable aux GPT personnalisés de ChatGPT.
Imagen 3 : Génération d'Images Améliorée
Imagen 3 vise à établir un nouveau standard en matière de qualité d'image, avec des protections intégrées pour éviter les problèmes de diversité rencontrés auparavant. Selon Dave Citron, responsable produit Gemini, "Imagen 3 se distingue favorablement par rapport à d'autres modèles de génération d'images sur divers benchmarks." Cet outil mis à jour permet aux utilisateurs de guider la création d'images avec des invites supplémentaires si le résultat initial ne correspond pas à leurs attentes.
Le nouveau modèle intègre également la technologie SynthID de Google pour apposer des filigranes sur les images, les identifiant clairement comme générées par IA, afin d'éviter toute confusion avec des photographies réelles. Citron a indiqué que la possibilité de générer des images de personnes sera bientôt disponible pour les utilisateurs payants, avec des garde-fous pour interdire la création d'“individus photoréalistes et identifiables”, ainsi que d'images impliquant des enfants ou tout contenu graphique, violent ou sexuel. Bien qu'il reconnaisse que les images de Gemini peuvent ne pas être parfaites, il a assuré aux utilisateurs que l'entreprise continuera d'affiner le modèle en fonction des retours.
Découverte de Gems : Chatbots Personnalisés pour une Fonctionnalité Améliorée
Les Gems, initialement présentés lors de Google I/O 2024, permettent aux utilisateurs de créer des chatbots personnalisés adaptés à des tâches spécifiques. Cette fonctionnalité offre une solution aux utilisateurs nécessitant de l'aide pour des projets, des sessions de brainstorming ou même la rédaction de légendes pour les réseaux sociaux. Citron a souligné que "votre Gem peut se souvenir d'un ensemble détaillé d'instructions pour vous faire gagner du temps sur des tâches répétitives ou difficiles."
Pour favoriser l'engagement des utilisateurs, Gemini proposera également des Gems prédéfinis destinés à inspirer la créativité et à rationaliser les processus de travail. Parmi les Gems disponibles figurent :
- Coach d'Apprentissage : Aide à comprendre des sujets complexes.
- Générateur d'Idées : Stimule de nouvelles idées pour vos projets.
- Conseiller de Carrière : Aide à l'amélioration des compétences et aux décisions professionnelles.
- Éditeur de Rédaction : Fournit un retour constructif sur la grammaire et la structure.
- Partenaire de Code : Aide les développeurs à améliorer leurs compétences en codage et à inspirer de nouveaux projets.
Les Gems sont déployés dès aujourd'hui pour les versions desktop et mobile, mais ne sont actuellement accessibles qu'aux abonnés Gemini Advanced, Business et Enterprise. Pour profiter de ces fonctionnalités innovantes, les utilisateurs devront opter pour un plan payant.
En renforçant ses capacités d'IA, Google vise à fournir des outils plus intuitifs et efficaces, répondant ainsi à la demande croissante pour des technologies génératives sophistiquées.