Avec Quiet-STaR, les modèles de langage apprennent à analyser avant de répondre.

Home Actualités IA Avec Quiet-STaR, les modèles de langage apprennent à analyser avant de répondre.

Avancées en Raisonnement AI : Présentation de Quiet-STaR

Les humains ont une capacité unique à raisonner, se posant des questions de type « si » et « pourquoi » et interprétant des informations implicites pour résoudre des problèmes complexes. Cependant, les modèles d'IA traditionnels ont peiné à atteindre ce niveau de raisonnement. Des chercheurs de l'Université de Stanford et de Notbad AI, Inc. ont développé Quiet-STaR, une extension novatrice du modèle Self-Taught Reasoner (STaR), qui enseigne à l'IA à réfléchir avant de répondre, imitant ainsi les processus de pensée humains.

Améliorations de Quiet-STaR

Quiet-STaR a été intégré au modèle Mistral 7B, améliorant considérablement ses capacités de raisonnement en zéro-shot. Des avancées notables ont été observées dans :

- L'exactitude de réponse de CommonsenseQA (passant de 36,3 % à 47,2 %)

- La résolution de problèmes de mathématiques de niveau école primaire dans GSM8K (de 5,9 % à 10,9 %)

Ces améliorations sont directement corrélées au nombre de tokens représentant les pensées internes du modèle. Les chercheurs affirment : « Quiet-STaR représente un pas vers des modèles linguistiques capables d'apprendre à raisonner de manière plus générale et évolutive. »

Limites précédentes du Raisonnement IA

Les approches antérieures du raisonnement AI s'appuyaient fortement sur un entraînement spécifique à chaque tâche, ce qui limitait la généralisabilité. Les modèles étaient souvent formés avec des ensembles de données soigneusement sélectionnés, centrés sur des tâches étroites, ce qui restreignait leur capacité à s'adapter à une large gamme de scénarios.

Par exemple, bien qu'un modèle linguistique ajusté au raisonnement humain ait surpassé une IA de réponse directe, ces méthodologies demeurent confinées à des ensembles de données spécifiques. Le modèle STaR a démontré que les IA pouvaient améliorer leurs compétences en raisonnement grâce à un apprentissage itératif à partir d'ensembles de données de questions-réponses, mais la dépendance à des données sélectionnées a limité son évolutivité.

« S'entraîner à partir de ces ensembles de données ne couvrira qu'une fraction des tâches de raisonnement », soutiennent les chercheurs, soulignant la nécessité pour les modèles d'extraire des justifications à partir d'entrées textuelles variées.

La Méthodologie Quiet-STaR

La technique Quiet-STaR fonctionne en générant plusieurs pensées internes à chaque token, s'engageant dans un processus de « réflexion » avant de fournir une réponse. Cela permet à l'IA d'évaluer un texte futur avec un contexte enrichi. En utilisant l'algorithme REINFORCE, le modèle optimise ses prédictions, écartant les sorties moins précises et affinant itérativement son raisonnement durant l'entraînement.

Pour encourager un raisonnement généraliste, les chercheurs ont utilisé une invite zéro-shot (« Pensons étape par étape ») et ont formé Quiet-STaR sur des ensembles de données textuelles variées provenant du web, tels qu'OpenWebMath et Colossal Clean Crawled Corpus. « Quiet-STaR permet à un modèle de réfléchir calmement à chaque niveau de token, facilitant une distribution qui renforce son utilité », notent-ils.

La Menace de Hacking des Chatbots IA Internes avec de l'Art ASCII : Le Pire Cauchemar d'une Équipe de Sécurité

La startup de gestion des risques liée à l'IA, ValidMind, obtient 8,1 millions de dollars de financement pour aider les banques à se conformer aux réglementations.

Most people like

HitPaw Voice Changer

2.4M

Transformez votre voix instantanément grâce à un changeur de voix AI innovant en temps réel, offrant une vaste gamme d'effets époustouflants. Découvrez une modulation vocale sans faille et élevez votre créativité audio dès aujourd'hui !

Changeur de voix AI Voice Changer

YesChat.ai

2.6M

YesChat.ai exploite les puissantes capacités de GPT-4V, DALL-E 3 et Claude 2 pour améliorer ses fonctionnalités avancées de chatbot IA.

ChatGPT4V AI Chatbot

Algor Education

1.3M

Transformez tout texte en cartes conceptuelles alimentées par l'IA. Découvrez comment la technologie avancée peut visualiser des idées, améliorer la compréhension et optimiser l'apprentissage grâce à des cartes conceptuelles personnalisables issues de votre contenu.

Alimenté par l'IA AI Education Assistant

Vidnoz AI Video Translator

10.3M

Traduisez des vidéos en plus de 140 langues en seulement 3 étapes simples ! Déverrouillez le potentiel mondial de votre contenu grâce à notre processus facile à suivre pour traduire des vidéos en plus de 140 langues. Que vous cherchiez à toucher un public plus large ou à améliorer l'engagement de votre audience, notre approche simplifiée garantit que vos messages résonnent auprès des spectateurs du monde entier. Dites adieu aux barrières linguistiques et accueillez un public multilingue et plus connecté !

traduction vidéo Translate

Find AI tools in YBX