Presentamos el modelo de IA Qwen2 de Alibaba Cloud: rendimiento mejorado y soporte para 128K tokens en el procesamiento de contextos largos.

Hoy, Alibaba Cloud ha anunciado una actualización de su serie de modelos de código abierto de inteligencia artificial, conocida como Qwen, ahora designada como Qwen2. Esta actualización presenta cinco modelos preentrenados y ajustados a instrucciones de diferentes tamaños, mejorando significativamente el rendimiento en múltiples capacidades, incluyendo funciones de programación y matemáticas, además de soportar longitudes de contexto más extensas.

La serie Qwen2 incluye cinco modelos: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B y Qwen2-72B. Destaca el modelo Qwen2-72B-Instruct, que puede manejar longitudes de contexto de hasta 128K tokens, ofreciendo a los usuarios una capacidad de procesamiento de texto extensa.

En cuanto a los datos de entrenamiento, la serie Qwen2 ha integrado datos de alta calidad de 27 idiomas adicionales, además del chino y el inglés, lo que potencia significativamente sus capacidades multilingües. Todos los modelos utilizan la tecnología de Entrenamiento Consciente de Cuantización Basada en Gradientes (GQA), lo que acelera la velocidad de inferencia y reduce el uso de memoria, resultando en una experiencia de usuario más eficiente y estable.

Los resultados de evaluación indican que los modelos grandes de la serie Qwen2 han mostrado mejoras notables. Específicamente, el modelo Qwen2-72B supera a modelos líderes como Llama-3-70B y Qwen1.5-110B en comprensión de lenguaje natural, procesamiento de conocimiento, programación, matemáticas y capacidades multilingües. Este logro subraya la posición destacada de la serie Qwen2 en el desarrollo de modelos de IA.

Como parte del compromiso de Alibaba Cloud con la innovación y el desarrollo de la inteligencia artificial, el lanzamiento de la serie Qwen2 no solo presenta modelos de IA avanzados y eficientes, sino que también resalta la capacidad tecnológica e innovadora de Alibaba Cloud en el sector de la IA. Esperamos con interés el lanzamiento futuro de más modelos y tecnologías excepcionales de Qwen que contribuyan a los avances en este campo.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles