El marco de inferencia Archon mejora la velocidad y la eficiencia de los LLM sin costo adicional.

Home Noticias de IA El marco de inferencia Archon mejora la velocidad y la eficiencia de los LLM sin costo adicional.

Investigadores del Laboratorio de Escalamiento de Inteligencia de la Universidad de Stanford han presentado un nuevo marco de inferencia llamado Archon, diseñado para mejorar la eficiencia de los modelos de lenguaje grandes (LLMs) en la generación de respuestas. Archon utiliza un algoritmo de búsqueda de arquitectura en tiempo de inferencia (ITAS) que optimiza el rendimiento de los LLM sin requerir entrenamiento adicional. Este marco, independiente del modelo y de código abierto, es fácilmente implementable tanto en modelos grandes como pequeños.

Archon busca ayudar a los desarrolladores a crear sistemas de inteligencia artificial al aprovechar diversas técnicas de inferencia para agilizar la generación de respuestas. Según el Laboratorio de Escalamiento de Inteligencia, estas técnicas pueden reducir significativamente los costos asociados con el desarrollo y la inferencia del modelo. A medida que los LLM evolucionan hacia parámetros más grandes y razonamiento más sofisticado, los gastos pueden aumentar, a pesar de las expectativas de empresas como OpenAI de una mayor asequibilidad.

Los investigadores enfatizan que Archon crea automáticamente arquitecturas que mejoran la generalización de tareas, permitiendo a los modelos abordar desafíos más allá de su ámbito de entrenamiento original. "Nuestro marco Archon y el algoritmo ITAS están inspirados en arquitecturas neuronales y prácticas de búsqueda de arquitecturas", explicaron. "Archon consta de capas de LLM, donde los modelos dentro de la misma capa operan en paralelo, mientras que cada capa subsiguiente procesa los resultados secuencialmente."

Estas capas emplean diversas técnicas de inferencia para modificar las respuestas candidatas, utilizando tanto generación y fusión (como transformaciones lineales) como refinamiento de respuestas (como no linealidades).

En pruebas de referencia, incluyendo MT-Bench, Arena-Hard-Auto, Alpaca-2.0 Eval, MixEval, MixEval Hard, MATH y CodeContests, Archon superó a GPT-4o y Claude 3.5 Sonnet por 15.1 puntos porcentuales, así como a modelos de LLM de código abierto por 11.2 puntos porcentuales.

Componentes de Archon

El algoritmo ITAS consta de varios componentes clave que ejecutan técnicas de inferencia:

1. Generador: Genera respuestas potenciales para el modelo.

2. Fusionador: Combina estas respuestas en una respuesta cohesiva. Por ejemplo, al preguntar por la capital de Francia, sintetiza respuestas como “la capital de Francia es París” y “Francia está en Europa” en una sola declaración: “La capital de Francia, un país en Europa, es París.”

3. Clasificador: Clasifica las respuestas generadas.

4. Crítico: Evalúa la calidad de las respuestas clasificadas.

5. Verificador: Comprueba la consistencia lógica y la corrección.

6. Generador y Evaluador de Pruebas Unitarias: Realiza pruebas pequeñas para verificar la precisión de las respuestas.

El enfoque estructurado de Archon permite una mejora más rápida en la calidad de las respuestas de los LLM, sin necesidad de ajuste adicional.

Limitaciones de Archon

Actualmente, Archon funciona mejor con LLM que tienen 70 mil millones de parámetros o más, como Code Llama 70B de Meta. Esta limitación surge de la capacidad reducida de los modelos más pequeños para seguir instrucciones debido a ventanas de contexto más estrechas. La investigación destacó una caída de rendimiento significativa del 16% cuando Archon se aplicó a modelos de 7B.

Además, los modelos que utilizan el marco Archon están un 15.7% por detrás de los modelos de un solo turno. El laboratorio de Stanford señaló que Archon no es adecuado para aplicaciones que requieren la latencia rápida de una llamada única de LLM, como los chatbots. Su arquitectura implica múltiples llamadas a LLM, lo que la hace menos efectiva para tareas sencillas de consulta-respuesta. Sin embargo, Archon puede destacar en la resolución de tareas más complejas que requieren instrucciones intrincadas, como la programación o escenarios avanzados de servicio al cliente.

A pesar de estos desafíos, los investigadores esperan que Archon pueda acelerar el desarrollo de LLM de alto rendimiento sin necesidad de una inversión de capital adicional en inferencia y entrenamiento.

El SCoRe de DeepMind demuestra cómo los LLM aprovechan el conocimiento interno para corregir errores de forma autónoma.

DevDay 2024 de OpenAI: 4 Actualizaciones Clave para Mejorar la Accesibilidad y la Asequibilidad en la IA

Most people like

Mixpeek

44.6K

Descubre Mixpeek: una avanzada solución de almacenamiento de archivos inteligente con potentes capacidades de búsqueda. Desbloquea el potencial de tus archivos con una función de búsqueda ultrarrápida que facilita más que nunca la organización y recuperación de tus documentos.

herramienta de IA AI Search Engine

Viggle AI

27.1K

Transformar imágenes estáticas en videos cautivadores nunca ha sido tan fácil, gracias al innovador generador de videos a partir de imágenes con IA. Esta tecnología de vanguardia utiliza inteligencia artificial para animar tu contenido visual, permitiéndote dar vida a fotografías e ilustraciones. Ya seas un creador de contenido, un comercializador o simplemente busques mejorar tu narrativa digital, esta herramienta abre un mundo de posibilidades creativas. Descubre cómo el generador de videos a partir de imágenes con IA está redefiniendo la forma en que visualizamos y compartimos nuestras ideas a través de visuales dinámicos.

Herramienta de animación de IA AI Character

AI t-shirt design generator

187.8K

Desata tu creatividad diseñando y personalizando camisetas con tecnología de inteligencia artificial de vanguardia. Convierte tus ideas en prendas impresionantes que destacan, permitiéndote expresar tu individualidad sin esfuerzo. ¡Descubre cómo la IA puede revolucionar tu experiencia de diseño de camisetas hoy!

Generador de Diseño AI AI Photo & Image Generator

PeopleAI

Eleva tu marca personal y mejora tu visibilidad en línea con la innovadora tecnología de gemelos digitales de PeopleAI.

gemelo digital AI Chatbot

Find AI tools in YBX