Les efforts d'Apple en matière d'IA : L'essor d'Apple GPT
Récemment, des rumeurs ont circulé selon lesquelles Apple développerait un chatbot nommé Apple GPT, conçu pour imiter le ChatGPT d'OpenAI en utilisant les propres modèles d'IA d'Apple. À une époque où les produits d'IA générative émergent rapidement—des smartphones Pixel de Google aux séries Galaxy S24 de Samsung—Apple reste assez discret. Le PDG Tim Cook a informé les investisseurs que l'IA générative serait introduite plus tard cette année, marquant un "nouveau chapitre" pour l'entreprise. De plus, il semblerait qu'Apple envisage de solliciter l'aide de Google ou même d'OpenAI pour atteindre ses objectifs.
Selon Bloomberg, Apple est en négociations avec Google pour acquérir une licence pour le modèle d'IA Gemini sur l’iPhone, une stratégie qui rappelle celle de Samsung avec la série Galaxy S24 utilisant le modèle Gemini Nano de Google. Bien que les détails de l'accord restent flous, Apple semble également en discussion avec OpenAI. Étant donné que la technologie d’OpenAI est déjà intégrée aux produits Microsoft et aux applications indépendantes comme ChatGPT Plus, l’excitation et l'inquiétude entourent les ambitions d'Apple en matière d'IA.
Les développements d'IA d'Apple
À la fin de 2023, Apple a discrètement lancé une gamme de modèles et de frameworks d’IA fonctionnant sur ses puces, pour intégrer des capacités d'IA générative à sa gamme de Mac, semblable aux efforts de Qualcomm avec sa plateforme Snapdragon X Elite. De plus, l'équipe de recherche d'Apple a publié un article sur un outil d'IA générative nommé Keyframer, qui utilise le modèle GPT-4 pour le traitement d'images statiques via des graphiques vectoriels.
Un autre outil innovant permet la modification d'images par des commandes vocales simples, similaire à l'outil d'édition multimédia assisté par voix de Qualcomm, promu dans leur dernier chip Snapdragon. Les rapports de suivi de Bloomberg soulignent qu'Apple renforce son équipe spécialisée pour examiner les capacités de l'IA générative, avec l'objectif de fournir ces outils aux développeurs d'ici 2024.
Des rumeurs suggèrent que les premières fonctionnalités d'IA générative d'Apple pourraient apparaître en juin avec la sortie d’iOS 18, axées sur les fonctionnalités locales plutôt que sur des solutions basées sur le cloud.
La fonctionnalité locale de Gemini
Gemini fonctionne localement sur le téléphone tout en maintenant la connectivité Internet, offrant diverses fonctionnalités. Par exemple, il peut résumer des conversations dans l'application d'enregistreur vocal, fonctionnant même hors ligne. De plus, Gemini Nano apporte des fonctionnalités de réponses intelligentes à l’application de clavier Gboard, offrant des suggestions contextuelles et des capacités de traduction hors ligne.
Une fois l'application Gemini installée, les utilisateurs peuvent interagir par langage naturel pour obtenir de l'aide dans la rédaction, le brainstorming et le résumé rapide d'e-mails et de documents, générer des images, récupérer des informations de scène, interpréter le contenu de l'écran et planifier des voyages avec Google Maps et Google Flights.
Les perspectives de collaboration d'Apple avec Google
Comme mentionné précédemment, la collaboration étroite de Samsung avec Google a permis l'adoption du modèle d'IA Gemini Nano sur ses appareils phares, un partenariat qu'Apple pourrait également mettre en œuvre. Même si les négociations de licences pour les appareils échouent, Gemini pourrait tout de même être accessible via des applications. Cependant, bien que la licence de Gemini puisse modifier considérablement l'interaction des utilisateurs avec l’iPhone, son potentiel pour améliorer Siri reste incertain.
Actuellement, Google n'a pas entièrement intégré Gemini avec Google Assistant. Bien que Gemini puisse remplacer l'Assistant sur les appareils Android, Google Assistant demeure essentiel pour de nombreuses tâches quotidiennes. Étant donné l'écosystème logiciel étroitement intégré d'Apple, la répartition des rôles entre Gemini et Siri pourrait provoquer de la confusion chez les utilisateurs.
Apple pourrait également collaborer avec Google pour créer des solutions d'intégration uniques combinant Gemini avec les fonctionnalités de l'écosystème d'Apple. Cependant, étant donné les politiques actuelles de stockage de données de Gemini, la probabilité d'une intégration profonde semble discutable.
Les défis à venir pour Apple
Il est clair qu'Apple prend du retard dans le secteur de l'IA générative et est désireux de rattraper son retard. L'accord de licence avec Gemini indique que nous ne verrons peut-être jamais les développements d'IA d’Apple du projet Ajax se réaliser pleinement et devrons nous contenter d'une alternative compromise. Malgré les capacités puissantes de Gemini, il n’est pas exempt de défauts ; les utilisateurs ont souligné d'importantes incohérences dans la génération d'images, notamment en ce qui concerne le teint de la peau et l'ethnicité.
Alors que les controverses s'intensifient, Google a suspendu la fonctionnalité de génération d'images à partir de texte de Gemini. Dans une note interne, le PDG de Google a reconnu que de telles erreurs sont "complètement inacceptables". En Inde, Gemini a suscité des discussions autour de remarques politiquement sensibles, mettant en lumière l'urgence de la régulation de l'IA.
Pour une entreprise comme Apple, connue pour son approche prudente face à la surveillance gouvernementale, promouvoir Gemini à l'échelle mondiale représente un risque majeur. Avec Google mettant en garde les utilisateurs contre les erreurs potentielles de Gemini, Apple doit évaluer attentivement cette initiative.