Hoy, Alibaba Cloud ha anunciado una actualización de su serie de modelos de código abierto de inteligencia artificial, conocida como Qwen, ahora designada como Qwen2. Esta actualización presenta cinco modelos preentrenados y ajustados a instrucciones de diferentes tamaños, mejorando significativamente el rendimiento en múltiples capacidades, incluyendo funciones de programación y matemáticas, además de soportar longitudes de contexto más extensas.
La serie Qwen2 incluye cinco modelos: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B y Qwen2-72B. Destaca el modelo Qwen2-72B-Instruct, que puede manejar longitudes de contexto de hasta 128K tokens, ofreciendo a los usuarios una capacidad de procesamiento de texto extensa.
En cuanto a los datos de entrenamiento, la serie Qwen2 ha integrado datos de alta calidad de 27 idiomas adicionales, además del chino y el inglés, lo que potencia significativamente sus capacidades multilingües. Todos los modelos utilizan la tecnología de Entrenamiento Consciente de Cuantización Basada en Gradientes (GQA), lo que acelera la velocidad de inferencia y reduce el uso de memoria, resultando en una experiencia de usuario más eficiente y estable.
Los resultados de evaluación indican que los modelos grandes de la serie Qwen2 han mostrado mejoras notables. Específicamente, el modelo Qwen2-72B supera a modelos líderes como Llama-3-70B y Qwen1.5-110B en comprensión de lenguaje natural, procesamiento de conocimiento, programación, matemáticas y capacidades multilingües. Este logro subraya la posición destacada de la serie Qwen2 en el desarrollo de modelos de IA.
Como parte del compromiso de Alibaba Cloud con la innovación y el desarrollo de la inteligencia artificial, el lanzamiento de la serie Qwen2 no solo presenta modelos de IA avanzados y eficientes, sino que también resalta la capacidad tecnológica e innovadora de Alibaba Cloud en el sector de la IA. Esperamos con interés el lanzamiento futuro de más modelos y tecnologías excepcionales de Qwen que contribuyan a los avances en este campo.