Les outils d'aujourd'hui facilitent la création d'applications alimentées par l'IA, mais de nombreux développeurs évitent souvent les complexités de l'hébergement de modèles. Choisir entre des options telles que GPT-4 d'OpenAI, Llama 3 de Meta, Gemini de Google ou divers modèles open source est un défi, mais le déploiement de ces modèles pose un tout autre ensemble de difficultés.
Cette tâche complexe peut frustrer les développeurs et freiner leurs aspirations entrepreneuriales. Cependant, Microsoft propose une solution qui permet aux développeurs de se recentrer sur leur créativité plutôt que sur des obstacles techniques. Leur offre de Models-as-a-Service (MaaS) s'apparente à des services cloud, permettant aux utilisateurs de payer pour l'accès aux modèles sans avoir à gérer l'infrastructure. Ce service est accessible via Microsoft’s AI Azure Studio.
« Si vous avez déjà déployé un modèle, vous savez que cela implique des combinaisons complexes de versions de Pytorch et de spécifications matérielles », explique Seth Juarez, responsable de programme pour la plateforme IA de Microsoft. « MaaS abstrait cette complexité. Si vous avez un modèle – qu'il soit open source ou créé par OpenAI – vous pouvez y accéder facilement via notre catalogue. En un clic, vous disposez d’un point d’accès opérationnel prêt à l'emploi. »
Avec MaaS, les développeurs peuvent louer facilement des API d'inférence et héberger des ajustements en fonction de l'utilisation, le tout sans avoir besoin d'une machine virtuelle. Juarez souligne que, bien que Microsoft propose plus de 1 600 modèles avec diverses fonctionnalités, l'objectif de MaaS est de simplifier l'intégration des fonctionnalités d'IA dans les logiciels.
Depuis son lancement en 2023, Microsoft a rendu disponibles certains modèles via MaaS. Au départ, des modèles tels que Mistral-7B et Llama 2 de Meta ont été introduits. Récemment, TimeGen-1 de Nixtla et Core42 JAIS ont rejoint la liste, avec d'autres modèles de AI21, Bria AI, Gretel Labs, NTT Data, Stability AI et Cohere à venir. Cependant, seule une petite partie des modèles disponibles dans AI Azure Studio correspond aux critères de MaaS.
L'éligibilité des modèles repose souvent sur des partenariats d'entreprise, bien que Juarez admette ne pas avoir de détails sur ces collaborations. D'autres modèles sont inclus parce que des modifications d'API ont standardisé leurs signatures de fonction pour garantir la compatibilité avec MaaS. Cependant, des modèles plus spécialisés doivent être déployés par d'autres méthodes. « C'est pourquoi certains sont classés comme Models-as-a-Service tandis que d'autres peuvent être intégrés dans votre propre conteneur pour une inférence gérée », explique Juarez.
Juarez anticipe un avenir où les développeurs auront le choix entre deux approches, comme être propriétaire ou locataire. « Dans ce modèle, vous possédez le conteneur entier et le modèle et gérez l'entretien, tandis qu'avec MaaS, nous nous occupons de cette maintenance pour vous. Plus nous prendrons en charge de modèles, plus les développeurs auront d'options de location », note-t-il.
Le MaaS n'est pas un concept nouveau, mais il marque un changement important dans le paysage technologique. Juarez estime que la dynamique a changé : au lieu que les entreprises technologiques dictent nos besoins, les consommateurs expriment désormais des attentes pour des fonctionnalités et services spécifiques. Cette évolution est alimentée par les avancées parallèles dans la recherche et la commercialisation de l'IA. « Nous assistons à cette inversion, où les utilisateurs sont maintenant moteurs de la demande grâce à l'utilisation généralisée d'outils comme ChatGPT, poussant les entreprises à rattraper leur retard et à offrir les expériences demandées », conclut-il.