La technique innovante de Google offre aux LLM une compréhension contextuelle illimitée.

Home Actualités IA La technique innovante de Google offre aux LLM une compréhension contextuelle illimitée.

Nouvelle recherche : Un contexte infini pour les modèles linguistiques

Une étude récente de Google révèle une avancée révolutionnaire dans les grands modèles linguistiques (LLMs) : l'introduction de l'Infini-attention. Cette technique innovante permet aux LLMs de traiter des textes d'une longueur infinie tout en maintenant des exigences constantes en mémoire et en calcul.

Comprendre la fenêtre contextuelle

La "fenêtre contextuelle" désigne le nombre de tokens qu'un modèle peut traiter simultanément. Par exemple, si une conversation avec ChatGPT dépasse cette fenêtre, ses performances chutent, car les tokens antérieurs peuvent être supprimés. Les organisations adaptent les LLMs à des applications spécifiques—en intégrant des documents et des connaissances sur mesure dans leurs requêtes—ce qui rend l'extension de la longueur contextuelle cruciale pour obtenir un avantage concurrentiel.

Infini-attention : un changement de game pour les LLMs

D'après les chercheurs de Google, les modèles utilisant l'Infini-attention peuvent gérer efficacement plus d'un million de tokens sans augmenter l'utilisation de mémoire. Cette tendance pourrait théoriquement s'étendre encore davantage. Les Transformers, l'architecture des LLMs, fonctionnent traditionnellement avec une "complexité quadratique", ce qui signifie que doubler la taille d'entrée de 1 000 à 2 000 tokens quadruple à la fois la mémoire et le temps de calcul. Cette inefficacité provient du mécanisme d'auto-attention, où chaque token interagit avec tous les autres tokens.

Pour atténuer ces contraintes, des recherches antérieures ont produit diverses méthodes pour étendre les longueurs de contexte des LLMs. L'Infini-attention combine des mécanismes d'attention traditionnels avec un module de "mémoire compressive" qui gère de manière efficace les dépendances contextuelles à la fois à court et à long terme.

Comment fonctionne l'Infini-attention

L'Infini-attention conserve le mécanisme d'attention original tout en intégrant une mémoire compressive pour traiter des entrées étendues. Lorsque l'entrée dépasse sa longueur contextuelle, le modèle transmet les états d'attention plus anciens à la mémoire compressive, maintenant des paramètres de mémoire constants pour une efficacité améliorée. La sortie finale est obtenue en fusionnant la mémoire compressive avec l'attention locale. Les chercheurs affirment : « Cette modification critique de la couche d'attention Transformer permet aux LLMs existants d'étendre leur contexte vers l'infini grâce à un pré-entraînement et un affinage continus. »

Performances et applications

L'efficacité de l'Infini-attention a été évaluée à l'aide de critères pour de longues séquences d'entrée. En modélisation linguistique à long contexte, l'Infini-attention a démontré une performance supérieure, affichant des scores de perplexité plus bas—indiquant une cohérence accrue—tout en demandant significativement moins de mémoire.

Lors de tests impliquant la "récupération de passkey", l'Infini-attention a réussi à extraire un nombre aléatoire d'un texte de jusqu'à un million de tokens, surpassant d'autres méthodes dans les tâches de résumé sur des textes allant jusqu'à 500 000 tokens. Bien que Google n'ait pas publié de détails spécifiques sur les modèles ou le code pour une vérification indépendante, les résultats sont cohérents avec les observations de Gemini, qui prend également en charge des millions de tokens en contexte.

L’avenir des LLMs à long contexte

Les LLMs à long contexte représentent un domaine de recherche vital parmi les principaux laboratoires d'IA. Par exemple, Claude 3 d'Anthropic gère jusqu'à 200 000 tokens, tandis que le GPT-4 d'OpenAI prend en charge une fenêtre contextuelle de 128 000 tokens.

Un avantage significatif des LLMs à contexte infini est leur potentiel à faciliter la personnalisation des applications. Au lieu de dépendre de techniques complexes comme l'affinage ou la génération augmentée par récupération (RAG), un modèle à contexte infini pourrait théoriquement traiter de nombreux documents, déterminant le contenu le plus pertinent pour chaque requête. De plus, les utilisateurs pourraient améliorer les performances de tâches spécifiques via une large entrée d'exemples sans nécessiter d'affinage.

Cependant, le contexte infini ne remplacera pas entièrement les méthodes existantes. Il abaissera plutôt les barrières d'entrée, permettant aux développeurs de prototyper rapidement des applications avec un effort technique minimal. À mesure que les organisations adoptent ces avancées, l'optimisation des pipelines LLM restera essentielle pour relever les défis de coût, de rapidité et de précision.

Elon Musk’s xAI dévoile Grok-1.5V : Le premier modèle d’IA multimodale

RecurrentGemma de Google intègre une IA linguistique avancée pour améliorer les performances des appareils de périphérie.

Most people like

Impossible Images

23K

Découvrez une bibliothèque d'images stock alimentée par l'IA, offrant une vaste collection d'images libres de droits, des téléchargements faciles et des mises à jour régulières pour garder vos projets actuels et attrayants. Améliorez votre créativité avec notre générateur d'images innovant !

bibliothèque d'images libres de droits AI Tools Directory

uPass

134.4K

Dans le paysage éducatif en constante évolution d'aujourd'hui, les étudiants rencontrent des défis uniques liés aux devoirs écrits et à l'intégrité académique. Avec l'essor des outils d'intelligence artificielle, il est essentiel de disposer de détecteurs d'IA fiables capables d'identifier le contenu généré par l'IA, tout en utilisant des réécrivains d'IA avancés qui permettent aux étudiants de produire un travail original et de haute qualité sans détection. Cette combinaison puissante permet aux apprenants d'améliorer leurs compétences en écriture et de maintenir leur intégrité académique, tout en naviguant dans les complexités de l'éducation moderne.

Détecteur d'IA AI Rewriter

Storytell.ai

139.4K

Découvrez une plateforme de productivité alimentée par l'IA, spécialement conçue pour les équipes, révolutionnant la manière dont vous collaborez et gérez vos projets. Cette solution innovante améliore l'efficacité, optimise les processus et favorise une communication fluide, permettant à votre équipe d'accomplir davantage ensemble. Découvrez comment notre plateforme transforme la productivité grâce à l'automatisation intelligente et à des analyses approfondies.

Plateforme de productivité alimentée par l'IA Other

Diagramming AI

91K

Simplifiez sans effort vos conceptions UML et de flux de travail grâce à la plateforme de diagrammation de pointe propulsée par l'IA.

Autre AI Project Management

Find AI tools in YBX