Plus tôt cette semaine, Cohere, une startup basée à Toronto cofondée par d'anciens chercheurs en IA de Google, a lancé son modèle de langage de grande taille (LLM) prêt pour l'entreprise : Command R+. L'annonce a mis en avant des métriques impressionnantes, montrant que Command R+ a dépassé GPT-4 d'OpenAI, le modèle qui alimente ChatGPT, dans divers tests de référence courants.
Command R+ est désormais accessible sur le service cloud Azure de Microsoft et, à partir d'aujourd'hui, sur Amazon SageMaker, une autre plateforme cloud majeure.
Structure de Tarification
Sur Azure, le coût d'accès à Command R+ est de 0,015 $ par 1 000 tokens pour les sorties du modèle et de 0,003 $ par 1 000 tokens pour les invites. Les tokens représentent des mots ou des parties de mots, et un excellent exemple interactif est proposé par le développeur open-source Simon Willison.
En revanche, sur SageMaker, la tarification est structurée différemment, avec des coûts variant de 82,89 $ à 146,93 $ par heure pour l'inférence en temps réel, soutenant ainsi les déploiements en production.
Engagement de Microsoft envers les Modèles IA
Microsoft a fièrement annoncé sur X (anciennement Twitter) que Command R+ était « d'abord disponible sur Microsoft Azure ». La société a publié un article de blog détaillant sa vaste bibliothèque de plus de 1 600 modèles fondamentaux provenant de divers fournisseurs, dont Databricks, Hugging Face et OpenAI.
« Command R+ est conçu pour les entreprises souhaitant exploiter leurs données internes pour des modèles linguistiques personnalisés et précis », a déclaré John Montgomery, vice-président corporate de la plateforme IA de Microsoft. Il a souligné que Command R+, associé à Cohere Embed et Rerank, offrira une précision de premier ordre pour des applications IA sophistiquées reposant sur des données d'entreprise.
Une Concurrence Intense dans les Offres IA Cloud
Le dernier mouvement de Microsoft inclut Command R+ après son investissement dans le modèle Mistral Large, provenant de la startup IA française du même nom. Avec son soutien continu à OpenAI, Microsoft vise à établir Azure comme la destination privilégiée pour les développeurs d'entreprise recherchant une variété d’options de modèles IA.
Pendant ce temps, Amazon élargit activement sa bibliothèque de modèles sur Bedrock, sa plateforme de développement axée sur les LLM, ayant récemment ajouté la famille de modèles Claude 3 d'Anthropic. La disponibilité de Command R+ sur AWS SageMaker, bien que absent de Bedrock, représente un développement significatif dans le marché compétitif du cloud.
La volonté d'offrir une sélection plus large de modèles IA par les principaux fournisseurs de cloud indique leur rivalité acharnée. Plus un fournisseur peut proposer de modèles, mieux il peut répondre aux divers besoins des clients—analogique à un supermarché offrant une vaste gamme de marques.
Pour Cohere, une présence sur des plateformes cloud et de développement IA renommées est cruciale pour sa croissance. Cette expansion pourrait potentiellement l'aider à élargir sa clientèle, notamment face à des défis de génération de revenus, selon les rapports. En revanche, OpenAI a attiré une croissance significative de sa clientèle d'entreprise, atteignant environ 600 000 abonnés.
Absence de Bedrock
Aidan Gomez, PDG et cofondateur de Cohere, a reconnu l'absence de Command R+ sur Amazon Bedrock sur X, encourageant les utilisateurs à demander son ajout.
En réponse à la question concernant l'absence de Command R+ sur Amazon Bedrock, un porte-parole d'AWS a déclaré : « AWS ne divulgue pas les feuilles de route des produits ; cependant, nous nous engageons à offrir les modèles fondamentaux les plus populaires et avancés à nos clients. Nos partenariats avec des fournisseurs de modèles comme Cohere sont essentiels à cette mission, et nous sommes impatients de collaborer davantage. »