Yoav Shoham, co-CEO d'AI21, une entreprise pionnière dans le domaine des modèles de langage à grande échelle (LLM), a répondu aux commentaires récents de certaines entreprises, dont Amazon, suggérant que les LLM perdent leur caractère unique. Shoham conteste fermement cette idée, affirmant : « Les modèles se différencient. »
AI21 se spécialise dans le développement de LLM adaptés à des tâches spécifiques, avec une expertise particulière dans la synthèse de textes pour des applications d'entreprise. Lors de mon entretien avec Shoham, nous avons exploré les récentes évolutions de l'IA générative, y compris les défis d'OpenAI et les annonces récentes d'Amazon AWS.
Les remarques de Shoham faisaient suite à une observation sur la perception selon laquelle les LLM pourraient perdre leur distinctivité. Swami Sivasubramanian, VP des données et de l'IA chez Amazon AWS, a souligné : « Si tous les fournisseurs construisent des modèles très similaires, où est la différenciation ? » Il a mis en avant l'importance pour les entreprises d'exploiter efficacement leurs données propriétaires afin de créer des applications IA uniques.
Cette idée a été reprise par Miguel Paredes, VP de l'IA et de la science des données chez Albertsons, qui a déclaré plus tôt ce mois-ci : « Ces modèles deviennent des commodités. » Il a souligné que l'accès à des modèles comme ChatGPT d'OpenAI et Google Bard est presque uniforme pour toutes les entreprises, les incitant à se concentrer sur leurs propres données pour obtenir un avantage concurrentiel.
Shoham a reconnu le rôle crucial des données, mais a soutenu que l'accent sur la création de systèmes IA exceptionnels reste centré sur les LLM, du moins pour le moment. « Créer un excellent modèle linguistique est un défi, et il peut falloir du temps pour évaluer ses capacités et ses limites, » a-t-il expliqué. Il a noté que les benchmarks traditionnels et même le prototypage direct offrent uniquement de faibles aperçus des véritables performances d'un modèle.
Il a souligné que même des tâches apparemment simples, comme la synthèse de textes, peuvent poser des difficultés pour les LLM. En se concentrant sur des tâches spécifiques, ces modèles peuvent s'améliorer de manière significative. Par exemple, le modèle de synthèse de texte d'AI21 a surpassé GPT-4, ChatGPT et Claude lors d'évaluations menées par une grande institution financière.
En regardant vers l'avenir, Shoham reconnaît que l'orientation évoluera au cours de la prochaine année. « Nous parlerons de systèmes d'IA intégrant des modèles de langage à grande échelle, ainsi que de nombreuses autres capacités. C'est un océan bleu—il y a largement de la place pour l'innovation. »