Ce matin, Microsoft a recruté de manière inattendue Sam Altman et Greg Brockman, ancien PDG et président d'OpenAI, respectivement. Cette décision semble être une tentative de Microsoft de réduire les impacts des récents troubles chez OpenAI, où le conseil d'administration a pris la décision controversée de renvoyer Altman juste avant le week-end.
La situation chez OpenAI demeure incertaine. Plusieurs chercheurs ont démissionné, et de nombreux employés et cadres s'opposent activement à cette décision. Parallèlement, la relation de Microsoft avec OpenAI est en mutation. L'entreprise envisage de créer une branche de recherche interne dirigée par Altman et Brockman, ce qui pourrait engendrer une concurrence avec OpenAI.
Une chose est certaine : OpenAI est fondamentalement transformé, tout comme ses produits, y compris ChatGPT et sa plateforme API. Cette upheaval met en lumière le paysage en rapide évolution de l'industrie de l'IA, où les débats sur les risques des systèmes d'IA avancés et les menaces potentielles de l'intelligence générale artificielle (AGI) vont perdurer.
De tels conflits risquent de ressurgir, en particulier dans les laboratoires d'IA concentrés sur l'équilibre entre recherche et développement de produits. Par conséquent, les entreprises qui dépendent de la technologie d'OpenAI doivent réévaluer leurs stratégies à mesure que la société navigue dans cette incertitude.
Dans ce contexte, le marché des modèles open-source pourrait émerger comme un bénéficiaire majeur. Contrairement aux plateformes à code fermé comme celles d'OpenAI, les modèles open-source offrent aux utilisateurs un contrôle et une responsabilité complets sur leurs applications. Ils évitent les écueils liés à un point de défaillance unique, tel qu'un serveur API ou un leadership indécis.
Selon des rapports, plus de 100 clients d'OpenAI ont contacté des concurrents comme Anthropic, Google Cloud, Cohere et Microsoft Azure après les turbulences.
Les entreprises peuvent choisir où et comment déployer des modèles open-source : sur leurs serveurs, dans des clouds publics ou via des plateformes de gestion de modèles. Les principaux fournisseurs de cloud offrent un accès fluide à des modèles open-source populaires comme Llama 2, Mistral, Falcon et MPT, y compris Microsoft Azure AI Studio et Amazon Bedrock. Cette variété permet aux entreprises d’adapter les modèles à leur infrastructure existante.
Les modèles open-source fournissent souvent des performances plus stables par rapport aux modèles propriétaires. Ces derniers ont connu plusieurs variations de performance ces derniers mois en raison de retrainings et d'ajustements continus. Les modèles propriétaires peuvent être perçus comme des systèmes opaques, rendant les sorties cohérentes difficiles à atteindre.
En revanche, les modèles open-source donnent aux entreprises le pouvoir de contrôler les mises à jour, de définir des mesures de sécurité et d'éviter les changements brusques causés par des facteurs externes, comme des exploits de jailbreak partagés en ligne. Le paysage des modèles open-source avance rapidement, encouragé par le partage de connaissances collaboratif entre chercheurs et développeurs.
De nombreux outils permettent désormais de personnaliser les modèles de langage de grande taille (LLMs) open-source selon des besoins spécifiques, offrant une flexibilité souvent absente des modèles propriétaires. Les entreprises peuvent utiliser des techniques comme la quantification pour réduire les coûts opérationnels ou l'adaptation de bas rang pour peaufiner les modèles à moindre coût, permettant ainsi à de nombreux modèles de fonctionner sur un seul GPU. Les modèles open-source peuvent être adaptés à une large gamme d'applications et de budgets.
Des entreprises comme OpenAI font face à la double exigence de rechercher l'AGI tout en livrant des produits qui génèrent des revenus pour financer leurs recherches. Ces objectifs sont souvent en conflit, comme le met en évidence la saga en cours d'OpenAI.
En réalité, la plupart des entreprises ne recherchent pas l'AGI, ni ne nécessitent des modèles de pointe comportant des trillions de paramètres. Ce dont elles ont besoin, ce sont des cadres fiables pour développer des applications LLM stables, même si cela signifie utiliser des modèles avec quelques milliards de paramètres. Cela représente une occasion significative au sein de l'écosystème open-source. Alors que les répercussions d'OpenAI se poursuivent, il est prévu que davantage d'entreprises se tournent vers les LLM open-source.
Les plateformes comme ChatGPT sont précieuses pour le prototypage rapide et l'exploration des capacités avancées de l'IA. Cependant, une fois que les entreprises auront identifié les bonnes applications, elles tireront davantage de bénéfices en investissant dans des technologies robustes qui restent stables, indépendamment des dynamiques changeantes au sein des sociétés qui les développent.