Améliorer la Prise de Décision dans les Modèles de Langage de Grande Taille : Deux Stratégies Modernes

Home Actualités IA Améliorer la Prise de Décision dans les Modèles de Langage de Grande Taille : Deux Stratégies Modernes

Les nouveaux modèles de langage de grande taille (LLM) comme ChatGPT d'OpenAI (en particulier GPT-4), Claude AI et Gemini ont montré des capacités décisionnelles limitées. Cet article explore les recherches récentes sur la prise de décision des LLM et ses implications pour leur avenir.

Traditionnellement, une prise de décision efficace par les LLM nécessite la reconnaissance de schémas ou de règles sous-jacents, qu'ils appliquent de manière flexible à de nouveaux scénarios. Une étude de l'Institut de Santa Fe a révélé que les LLM, y compris ChatGPT, ont du mal à "raisonner sur des concepts fondamentaux." Prendre des décisions judicieuses nécessite une compréhension approfondie du contexte du prompt et des conséquences potentielles des réponses.

Une mauvaise prise de décision par les LLM peut entraîner des résultats néfastes. Par exemple, en 2023, l'Association nationale des troubles alimentaires a suspendu son chatbot IA "Tessa" après qu'il a commencé à fournir des conseils nuisibles, comme suggérer des pesées hebdomadaires et un déficit calorique de 500 à 1 000 calories. La réaction du public a entraîné une désactivation rapide du chatbot.

Les LLM ont également tendance à générer des recommandations génériques. Une recherche d'INSEAD a montré que, face à des questions de stratégie d'entreprise, ChatGPT recourait souvent à des idées reçues, comme promouvoir le travail collaboratif et une culture de l'innovation. Toutefois, la stratégie d'entreprise est un processus complexe qui nécessite des insights sur mesure plutôt que des conseils génériques.

Un argument contre cela est que former les LLM spécifiquement pour des stratégies d'affaires ou des conseils en santé pourrait résoudre ces problèmes. Cependant, améliorer leur compréhension contextuelle ne peut pas se limiter à élargir leurs ensembles de données. Ajouter plus de données peut introduire des biais et augmenter la demande computationnelle sans améliorer la qualité des décisions.

Favoriser une Prise de Décision Contextuelle

La formation des LLM à une prise de décision adéquate au contexte nécessite une approche nuancée. Deux stratégies avancées dans la recherche actuelle en apprentissage automatique proposent des moyens d'améliorer la prise de décision des LLM pour qu'elle ressemble aux processus cognitifs humains. La première, AutoGPT, utilise un mécanisme auto-réflexif pour planifier et valider les sorties. La seconde, Tree of Thoughts (ToT), encourage une prise de décision efficace en s'éloignant du raisonnement linéaire traditionnel.

AutoGPT est conçu pour créer, évaluer et affiner des modèles de manière autonome afin d'atteindre des objectifs spécifiques. Des améliorations récentes à AutoGPT intègrent une stratégie d'« opinions supplémentaires », incorporant des modèles d'experts dans le processus décisionnel. Cette intégration permet aux LLM d'utiliser des informations pertinentes provenant de diverses analyses d'experts, améliorant ainsi les résultats grâce à une approche systématique de "pensée-raisonnement-plan-critique".

Si elle est mise en œuvre efficacement, AutoGPT, renforcé par des modèles d'experts, pourrait traiter plus d'informations que les humains, suggérant qu'il pourrait prendre des décisions plus éclairées. Cependant, une limitation d'AutoGPT est sa fenêtre contextuelle restreinte, pouvant mener à des boucles d'interaction infinies. Fournir toutes les informations pertinentes dès le départ donne souvent de meilleurs résultats que d'introduire progressivement des données au cours d'une conversation.

Simuler la Cognition Humaine avec Tree of Thoughts

Le cadre Tree of Thoughts (ToT) offre une méthode prometteuse pour améliorer la précision des LLM en imitant les processus cognitifs humains. La prise de décision humaine implique souvent de générer et d'évaluer plusieurs scénarios. ToT identifie les défauts de raisonnement linéaire dans les LLM, similaire à l'approche d'AutoGPT. Dans des expériences, ToT mesure la capacité des LLM à suivre des instructions en langage naturel pour accomplir des tâches telles que des énigmes et de l'écriture créative.

Le raisonnement linéaire traditionnel dans les LLM est représenté par la "Chaîne de Pensée", qui décrit un processus de prise de décision séquentiel. Toutefois, ToT cherche à améliorer les capacités d’auto-critique des LLM et à explorer diverses voies de raisonnement. Par exemple, dans le jeu des 24, la Chaîne de Pensée peinait à identifier différentes opérations mathématiques pour atteindre 24, entraînant un faible taux de précision. La capacité de ToT à évaluer plusieurs résultats a conduit à un taux de précision de 74 % dans la même tâche.

Si les LLM peuvent améliorer leur jugement de manière cohérente, les futures collaborations entre humains et IA pour la prise de décisions stratégiques pourraient devenir une réalité. Les applications de ToT s'étendent à la programmation, à l'analyse de données et à la robotique, tandis qu'AutoGPT aspire à une intelligence générale.

À mesure que la recherche académique évolue, de nouvelles stratégies pour améliorer la prise de décision cognitive chez les LLM émergent. Étant donné leur capacité inhérente à analyser efficacement d'énormes volumes de données, des avancées réussies pourraient permettre aux LLM d’égaler, voire de dépasser, les capacités décisionnelles humaines dans les années à venir.

ArenaX Labs présente l'infrastructure de jeu ARC AI et la plateforme de recherche SAI, propulsant l'innovation dans le secteur des jeux vidéo de nouvelle génération.

Edge IA : Votre chemin vers un avenir de l'IA durable et accessible

Most people like

SwapFaces AI

176.7K

Découvrez notre outil de échange de visages vidéo alimenté par une IA ultramoderne—une solution révolutionnaire qui transforme votre manière de créer et de partager des vidéos. Avec cette technologie innovante, échangez des visages dans vos vidéos en quelques clics, enrichissant ainsi votre narration et vos projets créatifs. Que vous soyez créateur de contenu, marketeur ou simplement en quête de divertissement, notre interface intuitive et nos algorithmes avancés rendent la production de transformations vidéo époustouflantes facile. Explorez des possibilités infinies et élevez le niveau de votre contenu vidéo dès aujourd'hui !

Outil de montage vidéo IA AI Face Swap Generator

Travellergram

44.7K

Découvrez des prix imbattables sur les hôtels, les vols et les excursions grâce à l'algorithme de pointe de Travellergram. Profitez d'une planification de voyage sans effort tout en optimisant votre budget.

voyager AI Trip Planner

RSIP Vision

15.1K

Dans le paysage de la santé en évolution rapide d'aujourd'hui, l'intersection de l'analyse d'images médicales et de l'intelligence artificielle (IA) révolutionne les diagnostics et les plans de traitement. En tant que leader dans ce domaine, nous nous engageons à améliorer les résultats des patients grâce à des techniques d'imagerie sophistiquées et des insights propulsés par l'IA. Nos efforts pionniers ne se contentent pas d'avancer la technologie, mais redéfinissent également les normes de soins en médecine, faisant de nous une pierre angulaire dans la quête d'une santé de précision. Découvrez comment nos innovations révolutionnaires façonnent l'avenir de l'imagerie médicale et améliorent l'efficacité des systèmes de santé.

Analyse d'images médicales Healthcare

Pixcap

395.9K

Révolutionnez l'UX/UI de votre application et vos pages d'atterrissage grâce à notre outil de design 3D personnalisable. Cette plateforme innovante vous permet de créer des visuels époustouflants qui captivent les utilisateurs et améliorent l'expérience globale. Libérez votre créativité et élevez votre présence numérique dès aujourd'hui !

Outil de conception 3D AI 3D Model Generator

Find AI tools in YBX