IBM vise à enseigner l'IA à parler le langage de votre entreprise pour une compréhension améliorée.

Lors de VB Transform 2024, David Cox d'IBM a souligné l'importance de l'innovation ouverte dans l'intelligence artificielle générative d'entreprise, s'appuyant sur l'engagement à long terme de l'entreprise envers les technologies open source. En tant que VP des modèles d'IA et directeur au MIT-IBM Watson AI Lab, Cox a présenté une vision qui défie et inspire le secteur technologique.

« L'innovation ouverte représente véritablement l'histoire du progrès humain », a déclaré Cox, en insistant sur le fait que ce concept est essentiel pour le développement technologique. Il a souligné l'importance de la conjoncture actuelle dans l'évolution de l'IA : « Nous devons prendre des décisions sur où investir et comment éviter le verrouillage. »

Cox a contesté la perception binaire de l'ouverture dans l'IA, affirmant que « l'ouverture n'est pas une seule chose. Elle englobe de nombreuses significations. » Il a évoqué l'écosystème émergent de modèles ouverts provenant de diverses sources, notamment des géants de la tech, des universités et même des gouvernements.

Cependant, il a exprimé des inquiétudes concernant la qualité de l'ouverture dans de nombreux grands modèles de langage (LLM). « Dans certains cas, vous n'avez qu'un enchevêtrement de chiffres, sans savoir comment c'est produit », a-t-il averti. Cette absence de transparence, a-t-il soutenu, complique la reproductibilité et compromet les principes fondamentaux de l'open source.

Cox a fait des parallèles avec les logiciels open source traditionnels, soulignant les caractéristiques ayant contribué à leur succès : mises à jour fréquentes, cycles de publication structurés, correctifs de sécurité et contributions actives de la communauté. « Tout est bien défini, permettant des contributions progressives tant des entreprises que de la communauté élargie », a-t-il noté.

Il a critiqué l'état actuel des LLM ouverts, affirmant que « bien qu'impressionnants, ils manquent souvent d'attributs open source fondamentaux. » Cox a souligné les calendriers de publication incohérents de certains fournisseurs, avec des modèles parfois non mis à jour après leur lancement initial. Cette inconsistance, selon lui, compromet l'essence même de l'open source et limite l'innovation pilotée par la communauté dans l'IA.

Cox a souligné l'engagement d'IBM envers la transparence à travers leur série Granite de modèles d'IA open source. « Nous divulguons tout sur le modèle », a-t-il déclaré, mettant en avant qu'ils ont rendu public tout le code de traitement pour garantir la qualité et le filtrage de contenu inacceptable.

Cox a soutenu que ce niveau d'ouverture ne compromet pas la performance. Il a présenté des benchmarks montrant que les modèles Granite sont à la pointe de la technologie, affirmant : « Vous n'avez pas à sacrifier la transparence pour une performance supérieure. »

Il a proposé une nouvelle perspective sur les LLM, les présentant comme des représentations de données plutôt que de simples outils de conversation. Avec des estimations indiquant que les LLM engloberont bientôt presque toutes les données disponibles publiquement, Cox a noté un écart significatif : le savoir-faire propre aux entreprises est largement non représenté dans ces modèles.

Pour y remédier, il a proposé une mission consistant à intégrer les données des entreprises dans les modèles de base pour libérer leur plein potentiel. Bien que des techniques comme la génération augmentée par recherche (RAG) existent, Cox a soutenu qu'elles échouent souvent à tirer parti de la connaissance unique des entreprises et des informations propriétaires.

Cox a esquissé une approche en trois étapes pour les entreprises : identifier un modèle de base open source fiable, créer une nouvelle représentation des données commerciales, puis déployer et mettre à l'échelle pour la création de valeur. Il a souligné la nécessité de transparence dans le choix d'un modèle de base, en particulier dans les industries réglementées, notant que de nombreux fournisseurs de modèles ne divulguent pas leurs données.

Le défi réside dans la fusion efficace des données propriétaires avec le modèle de base. Cox a argumenté que le modèle de base choisi doit être performant, transparent et open source pour offrir le contrôle et la flexibilité nécessaires aux entreprises.

Pour donner vie à sa vision, Cox a présenté InstructLab, une initiative conjointe entre IBM et Red Hat conçue pour intégrer les connaissances d'entreprise dans les modèles d'IA. « InstructLab permet de véritables contributions open source pour les LLM », a-t-il expliqué.

Le projet utilise une taxonomie structurée de la connaissance et des compétences mondiales, permettant aux utilisateurs d'améliorer la performance des modèles de manière précise. Cette approche structurée facilite l'intégration d'insights spécifiques aux entreprises, abaissant les barrières pour les experts de domaine afin de personnaliser les modèles.

InstructLab utilise un modèle « enseignant » pour générer des données d'entraînement synthétiques, fusionnant de manière transparente des données propriétaires avec des modèles de base sans sacrifier la performance. Notamment, il accélère le cycle de mise à jour des modèles à seulement un jour, contrastant avec les longs cycles de publication traditionnels.

Les idées de Cox et InstructLab d'IBM signalent un changement dans l'adoption de l'IA en entreprise, passant de modèles génériques à des solutions personnalisées qui reflètent l'expertise unique de chaque entreprise. À mesure que la technologie évolue, l'avantage concurrentiel pourrait dépendre de la capacité à transformer les connaissances institutionnelles en insights pilotés par l'IA. Le prochain chapitre de l'IA ne concerne pas simplement des machines plus intelligentes ; il s'agit de machines qui comprennent les affaires aussi intimement que leurs utilisateurs.

Most people like

Find AI tools in YBX