Microsoft a annoncé le lancement de Phi-3, un modèle de langage performant doté de 3 milliards de paramètres, capable de fournir des compétences de raisonnement avancées comparables à celles de modèles plus grands, mais à un coût nettement inférieur. Développé par Microsoft Research, Phi-3 sera disponible sur la plateforme Azure AI, permettant aux entreprises d'exploiter des solutions de traitement du langage naturel à la pointe de la technologie pour diverses applications.
« Ce qui importe, c'est que nous avons un modèle compact aux capacités rivalisant avec celles de modèles beaucoup plus grands, approchant de près les performances du GPT-3.5 », a déclaré Sébastien Bubeck, vice-président de Microsoft Generative AI. « Les progrès réalisés dépassent nos attentes initiales, car personne n'avait anticipé la taille nécessaire pour atteindre ces capacités. »
Phi-3 représente une étape décisive dans l'exploration par Microsoft des modèles de langage compacts. Après Phi-1 l'année dernière, suivi par Phi-1.5 et Phi-2, la série Phi a démontré des performances remarquables en codage, raisonnement de bon sens et tests de traitement du langage naturel avec des modèles allant de 1 à 2 milliards de paramètres.
Des solutions d'IA rentables pour les entreprises
« Lorsque les clients constatent ce qui est possible, ils cherchent avec empressement des moyens d'innover », a déclaré Eric Boyd, vice-président corporate de la plateforme Azure AI. « Sur Azure, nous facilitons le développement d'applications d'IA générative qui répondent à leurs besoins. Nous proposerons toujours les modèles les plus avancés, repoussant les limites de l'innovation tout en offrant des options de premier plan à chaque niveau de prix. »
Avec Phi-3, Microsoft a conçu un modèle polyvalent de 3 milliards de paramètres qui imite les capacités des modèles leaders comme le GPT-3.5 d'OpenAI, mais à une fraction du coût, et suffisamment adaptable pour fonctionner sur du matériel standard et même des smartphones. Cette avancée en matière d'efficacité des paramètres ouvre des opportunités d'IA transformatrices pour les entreprises qui, auparavant, étaient trop coûteuses à mettre en œuvre.
Engagement envers une IA responsable
Microsoft a donné la priorité aux principes d'IA responsable dans le développement de Phi-3. Les données d'entraînement du modèle ont été soigneusement examinées pour détecter la toxicité et les biais, complétées par des mesures de sécurité supplémentaires. Cette approche rigoureuse permet aux entreprises—en particulier celles des secteurs réglementés—d'exploiter en toute confiance les fonctionnalités avancées de Phi-3.
D'un point de vue technique, Phi-3 fonctionne sur l'ONNX Runtime optimisé pour les GPU NVIDIA, permettant un déploiement distribué sur plusieurs GPU ou machines pour maximiser le débit. Son architecture utilise des mécanismes d'attention efficaces et une précision numérique optimisée, offrant des performances élevées avec une taille de modèle relativement compacte.
Renforcement des entreprises grâce à une IA avancée du langage naturel
« L'avantage de cette couche fondationnelle dans un modèle plus petit est que les entreprises peuvent l'affiner avec leurs données pour atteindre des résultats exceptionnels dans des domaines spécifiques », a expliqué Bubeck. « Même dans des domaines spécialisés, l'intelligence générale reste cruciale. »
L'introduction de Phi-3—et son intégration dans la plateforme Azure AI—représente une avancée significative pour rendre les capacités des grands modèles de langage accessibles et rentables pour les entreprises de toutes tailles. Alors que les organisations s'efforcent de mettre en œuvre l'IA et de tirer parti de la valeur des données non structurées, des modèles sur mesure comme Phi-3 seront essentiels pour réaliser cette ambition.