À l'approche de Google I/O 2024, l'excitation grandissait autour des éventuelles annonces liées à l'IA de Google. L'événement a débuté avec une performance dynamique de Marc Rebillet, star de YouTube, qui est apparu dans une robe de chambre, sortant d'une énorme tasse.
Avec cette ambiance festive, Rebillet a invité les membres du public à partager des idées musicales audacieuses, mises en œuvre grâce au logiciel DJ IA de Google. Ce lancement animé a présagé l'accent mis sur l'intelligence artificielle, le PDG Sundar Pichai soulignant que le terme « IA » a été mentionné 121 fois.
À la fin de l'événement, deux questions persistaient : Google répond-il à des problématiques qui n’affectent pas réellement la vie quotidienne avec ses dernières innovations ? Existe-t-il un marché viable pour des appareils IA spécialisés à plusieurs centaines d'euros alors que les smartphones offrent déjà des capacités IA exceptionnelles ?
Évaluation des Dispositifs IA
Le marché propose actuellement des gadgets IA captivants, tels que le Rabbit R1 et le Humane AI Pin, ainsi que des pendentifs alimentés par l'IA. Leurs fonctionnalités varient : certains écoutent, d'autres conversent, passent des appels, enregistrent des vidéos, et se connectent à des bots IA bavards pour analyser leur environnement. Malgré leur innovation, la qualité d’expérience utilisateur a été décevante. Le rédacteur mobile Joe Maring décrit le Rabbit R1 comme l'un des pires gadgets qu'il ait rencontrés, et le Humane AI Pin n’a pas fait beaucoup mieux. Bien qu'il s'agisse de dispositifs de première génération, leur avenir semble incertain au vu des récents développements d’OpenAI et de Google.
L'Évolution des Capacités IA
Les capacités de l'IA progressent rapidement, notamment dans la technologie visuelle, permettant à l'IA d'interpréter le monde à travers une caméra. Lors de Google I/O 2024, Google a présenté Gemini Live, à la suite du lancement de GPT-4o par OpenAI, un modèle multimodal améliorant la capacité de l'IA à traiter le texte, l'audio et les visuels. Ces produits visent à offrir une interaction utilisateur fluide : il suffit de pointer une caméra vers presque n'importe quoi pour qu'IA fournisse des informations contextuelles, identifiant la pertinence des vêtements, traduisant des objets, et localisant des objets égarés comme des clés de voiture.
Bien que les expériences de ChatGPT et de Gemini Live diffèrent, elles partagent des capacités fondamentales, révélant l'écart entre l'IA sur smartphones et le matériel dédié.
Le Défi du Matériel
Le Rabbit R1 et le Humane AI Pin sont équipés de caméras de 8MP et 12MP, respectivement, permettant un certain traitement d’image. Cependant, ils ne peuvent rivaliser avec les caméras avancées et stabilisées des smartphones modernes. Un smartphone classique améliore la compréhension de l'IA en fournissant des visualisations de haute qualité, donnant un résultat bien plus clair, semblable à la comparaison de la qualité vidéo entre les smartphones abordables et ceux haut de gamme.
De plus, ces dispositifs IA fonctionnent avec des puces MediaTek et Qualcomm de milieu de gamme, manquant de la puissance de calcul que les smartphones contemporains offrent, capables d'exécuter des tâches IA de manière beaucoup plus rapide. Les utilisateurs ne veulent pas attendre 15 secondes pour une réponse, alors même qu'un simple assistant vocal peut gérer des demandes bien plus rapidement.
L'IA générative fonctionne de deux manières principales : par traitement dans le cloud, nécessitant une connexion Internet, ou par traitement hors ligne, comme avec le Gemini Nano sur Pixel 8 et certains appareils Samsung. Ce dernier permet à l’IA de fonctionner sans accès à Internet, mais actuellement, aucun dispositif IA autonome ne fonctionne sans connexion.
Les Avantages de l'IA sur Appareil
Avec des capacités d'IA sur appareil, les utilisateurs peuvent bénéficier de fonctionnalités telles que la transcription audio sur les téléphones Pixel sans nécessiter de connexion Internet. Des technologies comme la Traduction Automatique Neurologique de Google permettent des traductions en temps réel. Plus tard cette année, Gemini Nano avec Multimodalité permettra un traitement local pour des réponses contextuelles basées sur l'entrée de la caméra et du microphone.
Cette approche est non seulement plus rapide, mais améliore la sécurité des données, car les informations personnelles restent sur l'appareil au lieu d'être transmises en ligne. De plus, elle pourrait réduire les coûts associés à l’offre de fonctionnalités d'IA générative, répondant ainsi aux préoccupations des consommateurs concernant l'accessibilité financière au milieu de l'essor de l'IA.
L'Intégration de Gemini avec les Services Google
L'importance de l'intégration est évidente dans la suite de services de Google, y compris Gmail, Docs, Drive, Maps, Photos et Search. Gemini propose des assistants IA personnalisés conçus pour des tâches spécifiques alignées avec ces services. Les utilisateurs peuvent solliciter Gemini pour planifier des voyages, accédant à des e-mails pertinents et intégrant ces données avec Google Search pour créer des itinéraires de voyage complets. Pour ceux qui choisissent Gemini Advanced, encore plus de fonctionnalités sont disponibles, comme le traitement de PDFs, de code et de multimédia, résumant et fournissant des informations essentielles.
Gemini améliore les tâches directement dans les applications, agissant discrètement tout en aidant efficacement les utilisateurs en temps réel.
L'Avantage des Smartphones sur les Appareils IA Dédiés
Un assistant IA doit fournir un soutien pratique, équilibrant fonctionnalité et commodité. Il doit s’appuyer sur des données pertinentes pour améliorer les tâches personnelles et professionnelles sans frais supplémentaires. Les gadgets IA actuels comme le Rabbit R1 et le Humane AI Pin peinent à tenir cette promesse en raison de leurs limitations. Étant donné les capacités avancées des smartphones—et leur capacité à exécuter des IA sophistiquées sans les inconvénients du matériel spécialisé—investir dans des dispositifs inférieurs semble imprudent lorsque les utilisateurs peuvent compter sur leur téléphone pour des performances supérieures.
Dans le paysage en évolution de l'IA, les smartphones prennent les devants, rendant les appareils IA autonomes de plus en plus obsolètes.