"Une nouvelle ère de l'IA mobile." C'est ainsi que Samsung présente sa prochaine série de smartphones Galaxy S24. Lors de l'événement Unpacked à venir, la société promet "une toute nouvelle expérience mobile alimentée par l'IA."
Samsung n'est pas le premier à exploiter l'engouement actuel pour l'IA, suscité par des plateformes comme ChatGPT et Midjourney. Des acteurs majeurs des processeurs pour smartphones, comme Qualcomm et MediaTek, ont récemment mis en avant les impressionnantes capacités d'IA générative sur leurs derniers puces phares et milieu de gamme.
Il est clair que l'IA dominera le marketing des smartphones. Mais que peut-on réellement attendre ? La valeur ajoutée de ces "avancées en IA" reste incertaine et pourrait simplement consister à reconditionner des fonctionnalités existantes sous de nouveaux noms ou applications.
À partir de la série Galaxy S24, ces appareils seront équipés de la puce Snapdragon 8 Gen 3 de Qualcomm. Ce fabricant de puces fait des déclarations frappantes concernant ses capacités d'IA générative, suggérant qu'il peut créer des images à partir de requêtes textuelles en moins d'une seconde en utilisant la technologie Stable Diffusion. Qualcomm a fourni une explication détaillée sur l'optimisation de Stable Diffusion pour une utilisation sur appareil. Pendant ce temps, MediaTek affirme que son Dimensity 9300 permettra également de générer des images à partir de texte quasiment instantanément grâce à Stable Diffusion. Fait intéressant, l’iQoo 12, déjà équipé de la dernière puce de Qualcomm, ne mentionne pas ces fonctionnalités d'IA générative dans son marketing.
Si Samsung propose la génération d'images à partir de texte, quel en sera l'effet final ? Il reste incertain de savoir si cette fonctionnalité sera intégrée dans une application tierce ou dans une des applications de Samsung. La question clé est de savoir comment cela améliorera l'utilisation quotidienne du smartphone. Qu'est-ce qu'un utilisateur typique de Galaxy S24 ferait avec des images générées par IA à partir d'une simple requête textuelle ? Il pourrait les utiliser pour animer des conversations ou créer un buzz sur les réseaux sociaux.
Cependant, des complexités subsistent. Les utilisateurs devront générer des images à partir de texte, puis les enregistrer sur leur appareil ou les copier dans le presse-papiers, et enfin les coller dans leur application de chat préférée. Une solution idéale verrait Samsung intégrer cette génération d'images directement dans le clavier. Pourtant, on peut se demander pourquoi suivre ce processus alors que les émojis, GIFs et autocollants peuvent produire un effet similaire ? De plus, la résolution de sortie de 512 x 512 pixels peut ne pas suffire pour des tâches comme les devoirs universitaires ou les présentations professionnelles. Il peut également y avoir des coûts associés ; la démonstration de MediaTek mentionne une option premium. Les utilisateurs de Galaxy S24 pourraient faire face à des limites sur le nombre de générations d'images, entraînant une performance réduite ou des frais d'abonnement une fois les quotas atteints.
Si tel est le cas, cela soulève des inquiétudes quant à la praticité, étant donné que d'autres solutions, comme DALL-E d'OpenAI, sont facilement accessibles. Les utilisateurs peuvent générer des images gratuitement ou s'abonner à ChatGPT Plus pour une rapidité et une qualité améliorées avec le dernier modèle DALL-E 3. Qualcomm affirme que le Snapdragon 8 Gen 3 est le "premier à supporter des modèles d'IA générative multimodaux", ce qui signifie que le chatbot natif (basé sur le modèle Llama de Meta) acceptera des entrées par texte, images et voix. Cependant, cela n'est pas révolutionnaire, car de telles capacités existent déjà dans ChatGPT-4, bien qu'avec des conditions d'abonnement.
Une autre fonctionnalité intrigante mise en avant par Qualcomm est l'expansion d'images par IA, permettant aux utilisateurs d'élargir le canevas d'une image dans n'importe quelle direction. L'IA générative de l'appareil produirait intelligemment des pixels en fonction des requêtes des utilisateurs, ajoutant de nouveaux éléments à la scène. Bien que cela puisse montrer des capacités impressionnantes, modifier des photos personnelles contenant des souvenirs précieux risque de déformer ces souvenirs avec des visuels irréalistes.
La synthèse est un autre domaine clé pour l'IA générative sur appareil. Cela pourrait améliorer la manière dont les utilisateurs restent informés des actualités. Cependant, son efficacité dépend de sa facilité d'utilisation ; par exemple, permettre aux utilisateurs de résumer des articles d'actualités sans avoir à changer d'application améliorerait considérablement l'expérience.
D'autres fonctionnalités proposées, comme l'édition de photos par la voix, semblent pratiques, mais il est difficile d'évaluer leur véritable utilité alors que des options actuelles, comme des filtres en un clic, offrent déjà des expériences d'édition rapides et satisfaisantes. Lorsqu'on aborde des fonctionnalités basiques telles que la génération de réponses génériques aux chats ou l'obtention de réponses nécessitant normalement des recherches sur internet, de nouveaux défis surgissent.
Les modèles d'IA générative fonctionnant nativement sur les smartphones, comme Llama de Meta, ne sont pas les plus avancés, principalement en raison de ressources limitées. Prenons Google, par exemple ; le Pixel 8 Pro utilise une version basique de ses grands modèles de langage appelée Gemini Nano. Pourquoi ne pas opter pour un modèle plus performant, comme ChatGPT ou Pi, via des applications mobiles dédiées ?
Actuellement, l'application la plus pratique de l'IA générative pourrait résider dans la réduction de la dépendance aux services cloud, permettant des tâches hors ligne tout en renforçant la confidentialité des données. Idéalement, ces outils sur appareil devraient s'intégrer parfaitement avec les assistants virtuels existants comme Google Assistant, Alexa ou Siri. Imaginez demander à votre assistant IA de compiler toutes les images de chats de votre galerie dans un collage pour votre père, ou de planifier un voyage à Disneyland, avec les meilleurs prix de billets et un itinéraire organisé sur Google Agenda.
Si l'IA générative sur appareil garde les données des utilisateurs localisées, cela pourrait favoriser un environnement de confidentialité des données—du moins en théorie. Pour l’instant, la promesse des capacités d’IA de Samsung demeure incertaine. Il sera fascinant de voir si Samsung peut offrir des expériences d'IA générative significatives ou simplement fournir une collection de fonctionnalités tape-à-l'œil mais peu pratiques.