Los transformadores juegan un papel vital en el panorama de la inteligencia artificial generativa, pero no son el único método para el desarrollo de modelos. AI21 ha lanzado hoy nuevas versiones de su modelo Jamba, integrando transformadores con un enfoque de Modelo de Espacio de Estado Estructurado (SSM). Las versiones mini y grande de Jamba 1.5 mejoran las innovaciones introducidas con Jamba 1.0 en marzo. Utilizando un método SSM llamado Mamba, Jamba busca fusionar las fortalezas de ambos sistemas. El nombre "Jamba" se refiere a la arquitectura de Atención Conjunta y Mamba, prometiendo un rendimiento y precisión mejorados más allá de lo que cada modelo puede lograr por separado.
"Recibimos comentarios increíblemente positivos de la comunidad; este fue el primero—y sigue siendo uno de los únicos—modelos a escala de producción basados en Mamba," comentó Or Dagan, VP de Producto en AI21. "Esta arquitectura novedosa ha generado discusiones sobre el futuro de las arquitecturas de LLM y el papel de los transformadores."
La serie Jamba 1.5 presenta funcionalidades mejoradas, incluyendo llamadas a funciones, modo JSON, objetos de documento estructurados y modo de citas. Estas adiciones posicionan a los modelos como candidatos ideales para el desarrollo de sistemas de IA agente. Ambas versiones cuentan con una ventana de contexto sustancial de 256K y utilizan una arquitectura de Mezcla de Expertos (MoE), con Jamba 1.5 mini ofreciendo 52 mil millones de parámetros totales (12 mil millones activos) y Jamba 1.5 grande mostrando 398 mil millones de parámetros totales (94 mil millones activos).
Estos modelos están disponibles bajo una licencia abierta, y AI21 ofrece soporte y servicios comerciales. La empresa ha establecido asociaciones con AWS, Google Cloud, Microsoft Azure, Snowflake, Databricks y Nvidia.
Nuevas Funciones de Jamba 1.5: Acelerando la IA Agente
Los modelos Jamba 1.5 Mini y Grande cuentan con varias capacidades nuevas dirigidas a satisfacer las crecientes necesidades de los desarrolladores de IA:
- Modo JSON para un manejo eficiente de datos estructurados
- Citas para mejorar la responsabilidad
- API de Documentos para una mejor gestión del contexto
- Capacidades de Llamadas a Funciones
Según Dagan, estas mejoras son cruciales para los desarrolladores que avanzan en sistemas de IA agente. JSON (JavaScript Object Notation) se utiliza ampliamente para crear flujos de trabajo de aplicaciones, y su inclusión facilita relaciones de entrada/salida más claras en configuraciones de IA complejas, extendiéndose más allá del uso básico de modelos de lenguaje. La función de citas trabaja en conjunto con la nueva API de documentos.
"Enseñamos al modelo a atribuir contenido relevante a los documentos proporcionados durante la generación," explicó Dagan.
Distinguiendo el Modo de Citas del RAG
Es importante diferenciar el modo de citas del Generación Aumentada por Recuperación (RAG), aunque ambos buscan fundamentar las salidas de IA en datos confiables. Dagan aclaró que el modo de citas de Jamba 1.5 está diseñado para una integración fluida con la API de documentos, ofreciendo un enfoque más holístico en comparación con el RAG tradicional. En configuraciones estándar de RAG, los desarrolladores conectan un modelo de lenguaje a una base de datos vectorial, requiriendo que el modelo incorpore efectivamente los datos recuperados en sus salidas.
En contraste, el modo de citas en Jamba 1.5 está intrínsecamente entrelazado con el propio modelo, lo que le permite recuperar, integrar y citar explícitamente las fuentes de información utilizadas en sus salidas. Esta función mejora la transparencia y la trazabilidad en comparación con los flujos de trabajo convencionales de LLM, donde el razonamiento del modelo puede ser menos claro.
AI21 también apoya soluciones RAG y ofrece un servicio gestionado de extremo a extremo que incluye recuperación e indexación de documentos.
Mirando hacia el futuro, Dagan destacó el compromiso de AI21 de evolucionar sus modelos para satisfacer las demandas de los clientes, con un enfoque continuo en el avance de las capacidades de IA agente. "Reconocemos la necesidad de innovar en sistemas de IA agente, especialmente en lo que respecta a la planificación y ejecución," afirmó.