Les experts en médias et technologies affirment que les modèles de langage de grande taille (LLM) open source pourraient avoir une influence significative sur l'IA générative au sein des entreprises, possiblement même plus que les modèles propriétaires tels que ChatGPT d'OpenAI ou ceux d'Anthropic.
Malgré des expérimentations approfondies et de nombreux projets de preuve de concept avec des modèles open source, les entreprises bien établies ont tardé à dévoiler leurs applications concrètes. Pour y remédier, nous avons contacté les principaux fournisseurs de LLM open source, notamment Meta, Mistral AI, IBM, Hugging Face, Dell, Databricks, AWS et Microsoft.
Nos recherches ont révélé 16 cas de déploiement notables (voir la liste ci-dessous). Bien que ce chiffre soit modeste, les analystes de l'industrie s'attendent à une augmentation des applications open source d'ici la fin de l'année.
Retards dans l'adoption des LLM open source
L'un des raisons de l'adoption lente des modèles open source réside dans leur récent lancement. Meta a présenté son premier modèle open source majeur, Llama, en février 2023, trois mois après la sortie de ChatGPT en novembre 2022. Le modèle Mixtral de Mistral AI, salué dans plusieurs benchmarks, a été lancé il y a seulement un mois. Ainsi, les déploiements concrets ne commencent à émerger que maintenant. Les défenseurs de l'open source reconnaissent que la présence de modèles fermés dépasse actuellement celle des modèles open source, mais prévoient une réduction de cet écart.
Défis liés aux modèles open source
Les modèles open source actuels présentent certaines limites. Amjad Masad, PDG de la startup Replit, a souligné que le mécanisme de retour d'information pour le développement des modèles est inefficace en raison de la difficulté à contribuer à leurs améliorations. Cependant, beaucoup ont sous-estimé le degré d'expérimentation parmi les développeurs open source, qui ont créé des milliers de modèles dérivés, certains montrant des performances équivalentes ou supérieures à celles des modèles fermés sur des tâches spécifiques, comme FinGPT et BioBert.
La valeur limitée des grands modèles publics pour les entreprises
D'après Matt Baker, SVP Stratégie IA chez Dell, "Les grands modèles publics ont peu ou pas de valeur pour les entreprises privées." Baker a expliqué que ces modèles tendent à être trop généralisés et ne facilitent pas l'intégration facile des données d'entreprise privées, qui représentent environ 95 % du travail d'IA effectué par les organisations. Par conséquent, de nombreuses entreprises explorent des solutions open source pour le support client et la génération de code, utilisant souvent des codes personnalisés souvent incompatibles avec les LLM des modèles fermés.
Mouvement lent en raison des considérations d'entreprise
Andrew Jardine de Hugging Face a noté que les entreprises hésitent souvent à adopter des applications LLM car elles privilégient la confidentialité des données, l'expérience client et les implications éthiques. Les entreprises pilotent généralement des cas d'utilisation internes avant de s'étendre à des applications externes. Bien que les modèles fermés aient connu des déploiements significatifs vers la fin de 2023, les mises en œuvre open source devraient s'accélérer cette année.
Malgré leurs avantages, certaines entreprises trouvent l'open source encombrant. Travailler avec des API établies de fournisseurs comme OpenAI est souvent perçu comme plus simple que de gérer les problèmes de licence et de gouvernance des projets open source.
Combler le fossé entre modèles ouverts et fermés
Jardine a souligné que la distinction entre modèles ouverts et fermés devient de plus en plus floue. Par exemple, de nombreuses entreprises, y compris un grand groupe pharmaceutique, utilisent un LLM fermé pour des tâches internes et un modèle open source pour des fonctions spécifiques, comme l'identification d'informations sensibles. Ce choix reflète un désir de contrôle accru sur les données.
L'argument pour l'adoption de l'open source
À mesure que l'adaptation des modèles et les facteurs de coût évoluent rapidement, les entreprises sont susceptibles de rechercher la flexibilité de passer d'un modèle open source à un modèle fermé pour atténuer les risques. Les entreprises privilégient souvent les modèles open source pour conserver le contrôle sur des données sensibles tout en les affinant pour des applications spécialisées.
Plusieurs entreprises, comme Intuit et Perplexity, développent déjà des couches d'orchestration pour l'IA générative, permettant l'intégration fluide de divers modèles pour des tâches spécifiques, qu’elles soient ouvertes ou fermées. Bien que le déploiement de modèles open source à grande échelle puisse nécessiter plus d'efforts, ils peuvent offrir des économies de coûts à long terme, particulièrement pour les organisations disposant d'infrastructures existantes.
De nombreuses entreprises exploitent discrètement des modèles open source. Par exemple, des sociétés automobiles et des compagnies aériennes expérimentent des applications alimentées par la plateforme lakehouse de Databricks, intégrant des LLM open source.
Défis pour identifier les déploiements open source
Définir de véritables cas d'utilisation d'entreprises peut être délicat. Bien que de nombreux développeurs et startups créent des applications utilisant des LLM open source, notre objectif était de mettre en lumière des entreprises établies avec des applications significatives. Nous avons défini une entreprise comme ayant au moins 100 employés et nous nous sommes concentrés sur les utilisateurs finaux plutôt que sur les fournisseurs de technologie LLM.
La définition de "open source" présente également des défis, comme le montre Llama de Meta, qui possède une licence restreinte. De plus, bien que des sociétés comme Writer aient développé leurs propres LLM, seuls certains modèles sont open source, compliquant ainsi la classification.
Voici des exemples de déploiements d'entreprises documentés de LLM open source :
1. VMWare : Utilise le modèle StarCoder de Hugging Face pour une génération de code améliorée dans un environnement auto-hébergé, garantissant la sécurité du code propriétaire.
2. Brave : Le navigateur axé sur la confidentialité utilise le modèle Mixtral 8x7B pour son assistant conversatif, Leo.
3. Gab Wireless : Met en œuvre des modèles Hugging Face pour filtrer les messages pour la sécurité des enfants, bloquant les contenus inappropriés.
4. Wells Fargo : Utilise le modèle Llama 2 de Meta pour diverses applications internes, améliorant les ressources des employés.
5. IBM : Intègre des LLM open source dans son application AskHR, qui aide les employés avec des questions liées aux ressources humaines et est également utilisée dans de nouveaux services de conseil.
6. Grammy Awards : Collabore avec IBM pour "AI Stories", utilisant Llama 2 pour générer des insights et du contenu personnalisé pour les fans.
7-9. Masters Tournament, Wimbledon, US Open : Tirent parti de la technologie IBM pour des commentaires en temps réel et la génération de moments forts pendant les événements.
10. Perplexity : Une startup axée sur la réinvention de la recherche, utilisant des LLM open source pour la résumé des réponses dans son moteur de recherche.
11. CyberAgent : Emploie des LLM open source de Dell pour le modélisation de la langue japonaise adaptée aux besoins des utilisateurs.
12. Intuit : Combine ses propres LLM avec des modèles open source pour renforcer les capacités de sa fonctionnalité Intuit Assist.
13. Walmart : Développe des applications d'IA conversationnelles, ayant initialement utilisé le modèle BERT open source de Google.
14. Shopify : Déploie Llama 2 dans Sidekick, un outil d'IA qui facilite les tâches pour les propriétaires de commerce électronique.
15. LyRise : Une startup de mise en relation de talents créant un chatbot pour le recrutement, utilisant Llama pour les interactions.
16. Niantic : Utilise Llama 2 pour animer les interactions des personnages dans le jeu mobile Peridot.
Malgré les défis présents dans la définition et le suivi de ces déploiements, l'intérêt pour les LLM open source est en plein essor. À mesure que de plus en plus d'entreprises explorent leur potentiel, nous prévoyons une augmentation du nombre de cas d'utilisation publics. Nous continuerons de mettre à jour cette liste au fur et à mesure que de nouvelles informations apparaîtront.