La técnica innovadora de Google otorga a los LLMs una comprensión contextual ilimitada.

Home Noticias de IA La técnica innovadora de Google otorga a los LLMs una comprensión contextual ilimitada.

Nueva Investigación Desbloquea Contexto Infinito para Modelos de Lenguaje

Un estudio reciente de Google revela un avance revolucionario en los grandes modelos de lenguaje (LLMs): la introducción de la Infini-attention. Esta innovadora técnica permite que los LLMs procesen textos de longitud infinita manteniendo constantes las demandas de memoria y computación.

Entendiendo la Ventana de Contexto

La "ventana de contexto" se refiere al número de tokens que un modelo puede procesar simultáneamente. Por ejemplo, si una conversación con ChatGPT supera su ventana de contexto, el rendimiento se reduce significativamente, ya que se pueden descartar tokens anteriores. A medida que las organizaciones adapten los LLMs para aplicaciones específicas—integrando documentos personalizados y conocimiento en sus prompts—el enfoque en extender la longitud del contexto se vuelve esencial para obtener una ventaja competitiva.

Infini-attention: Un Cambio de Juego para los LLMs

Según los investigadores de Google, los modelos que utilizan Infini-attention pueden gestionar efectivamente más de un millón de tokens sin aumentar el uso de memoria. Esta tendencia podría extenderse teóricamente aún más. La arquitectura de los Transformers, base de los LLMs, opera tradicionalmente con "complejidad cuadrática", lo que significa que duplicar el tamaño de entrada de 1,000 a 2,000 tokens resulta en un cuadruplicado de memoria y tiempo de computación. Esta ineficiencia proviene del mecanismo de autoatención, donde cada token interactúa con todos los demás.

Para aliviar estas restricciones, investigaciones anteriores han desarrollado diversos métodos para extender las longitudes de contexto de los LLMs. Infini-attention combina los mecanismos de atención tradicionales con un módulo de "memoria compresiva" que maneja eficientemente dependencias contextuales tanto a largo como a corto plazo.

Cómo Funciona Infini-attention

Infini-attention preserva el mecanismo de atención original mientras integra memoria compresiva para manejar entradas extendidas. Cuando la entrada supera su longitud de contexto, el modelo transmite estados de atención más antiguos a la memoria compresiva, manteniendo constantes los parámetros de memoria para una eficiencia mejorada. La salida final se obtiene al fusionar la memoria compresiva con la atención local. Los investigadores afirman: “Esta modificación crítica en la capa de atención del Transformer permite que los LLMs existentes se extiendan a contextos infinitos mediante preentrenamiento y ajuste continuo.”

Rendimiento y Aplicaciones

La eficacia de Infini-attention se evaluó mediante referencias para secuencias largas de entrada. En el modelado de lenguaje de contexto largo, Infini-attention mostró un rendimiento superior, con menores puntuaciones de perplejidad—indicando mayor coherencia—demandando significativamente menos memoria. En pruebas de "recuperación de contraseñas", Infini-attention recuperó exitosamente un número aleatorio de un texto de hasta un millón de tokens, superando a alternativas en tareas de resumido de textos de hasta 500,000 tokens. Aunque Google no ha publicado detalles específicos del modelo ni código para verificación independiente, los hallazgos son consistentes con las observaciones de Gemini, que también soporta millones de tokens en contexto.

El Futuro de los LLMs de Contexto Largo

Los LLMs de contexto largo representan un área de investigación vital entre los principales laboratorios de IA. Por ejemplo, Claude 3 de Anthropic admite hasta 200,000 tokens, mientras que GPT-4 de OpenAI soporta una ventana de contexto de 128,000 tokens. Una ventaja significativa de los LLMs de contexto infinito es su potencial para personalizar aplicaciones con mayor facilidad. En lugar de depender de técnicas complejas como el ajuste fino o la generación aumentada por recuperación (RAG), un modelo de contexto infinito podría manejar teóricamente numerosos documentos, identificando el contenido más relevante para cada consulta. Además, los usuarios podrían mejorar el rendimiento en tareas específicas a través de amplia entrada de ejemplos sin necesidad de ajuste fino.

Sin embargo, el contexto infinito no reemplazará completamente los métodos existentes. En cambio, reducirá las barreras de entrada, permitiendo a los desarrolladores prototipar rápidamente aplicaciones con un esfuerzo de ingeniería mínimo. A medida que las organizaciones adopten estos avances, seguirá siendo esencial optimizar las canalizaciones de los LLMs para abordar desafíos de costo, velocidad y precisión.

xAI de Elon Musk presenta Grok-1.5V: El primer modelo de IA multimodal

RecurrentGemma de Google integra inteligencia artificial avanzada en lenguaje para mejorar el rendimiento de dispositivos en la edge.

Most people like

TeleportHQ

251.5K

TeleportHQ es una plataforma innovadora de bajo código diseñada para simplificar el diseño y desarrollo front-end, facilitando a desarrolladores y diseñadores la creación de interfaces impresionantes sin necesidad de amplios conocimientos de programación.

Bajo código AI Website Builder

Knowee AI

9.7K

Descubre cómo Knowee AI integra inteligencia artificial de vanguardia con una interfaz intuitiva, ofreciendo a los estudiantes universitarios una experiencia de estudio efectiva y sin esfuerzo.

Charlar con Imagen Homework Helper

Subscribr

56.6K

Presentamos una Herramienta de Guion para AI en YouTube: ¡Revoluciona tu Proceso de Creación de Contenido! ¿Buscas mejorar tus videos de YouTube con guiones atractivos? Nuestra herramienta de guion con IA está diseñada específicamente para creadores como tú. Con algoritmos avanzados y capacidades de procesamiento del lenguaje, te ayuda a generar contenido cautivador de forma rápida y sencilla. ¡Di adiós al bloqueo creativo y hola a la libertad artística! Ya sea que estés creando tutoriales, vlogs o contenido educativo, nuestra herramienta garantiza que tus guiones sean fascinantes y estén adaptados a tu audiencia. ¡Eleva tu producción de videos y cautiva a tus espectadores como nunca antes!

Impulsado por IA AI YouTube Assistant

Perchance AI

11.6M

Descubre una plataforma innovadora diseñada para crear generadores aleatorios sin esfuerzo. Esta herramienta versátil permite a los usuarios diseñar generadores personalizados para una amplia gama de aplicaciones, desde juegos y toma de decisiones hasta la lluvia de ideas y la narración creativa. Ya seas desarrollador, educador o un entusiasta creativo, esta plataforma te capacita para crear soluciones de aleatorización originales que cautiven e inspiren. ¡Desbloquea tu creatividad hoy con la plataforma definitiva para crear generadores de aleatoriedad!

Generador Aleatorio AI Tutorial

Find AI tools in YBX