アリババクラウドのQwen2 AIモデルを紹介:128Kトークン対応の長文処理でのパフォーマンス向上を実現

アリババクラウドは、本日、AIオープンソースモデルSiriーズ「Qwen」がアップグレードされ、新たに「Qwen2」として登場したことを発表しました。このアップデートでは、異なるサイズの5つの事前トレーニング済みおよび指示調整モデルが導入され、コーディングや数学機能を含む複数の能力において、パフォーマンスが大幅に向上し、より長いコンテキスト長にも対応しています。

Qwen2Siriーズには、以下の5つのモデルがあります:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B、Qwen2-72B。特に、Qwen2-72B-Instructモデルは最大128Kトークンのコンテキスト長を扱うことができ、広範なテキスト処理能力を提供します。

トレーニングデータに関しては、Qwen2Siriーズは中国語と英語に加え、27の追加言語の高品質データを統合し、多言語対応能力を大幅に強化しました。すべてのモデルは、推論速度を向上させ、メモリ使用量を抑える「勾配ベース量子化対応トレーニング(GQA)」技術を利用しており、これにより効率的で安定したユーザー体験が実現されています。

評価結果によると、Qwen2Siriーズの大規模モデルは顕著な改善を示しています。具体的には、Qwen2-72Bモデルは、自然言語理解、知識処理、コーディング、数学、多言語能力において、Llama-3-70BやQwen1.5-110Bなどの先進的なモデルを上回る性能を発揮しました。この成果は、AIモデル開発におけるQwen2Siriーズの先導的な地位を裏付けています。

アリババクラウドはAIの革新と発展に尽力しており、Qwen2Siriーズのリリースは、高度で効率的なAIモデルを導入するだけでなく、AI分野におけるアリババクラウドの技術力と革新能力を示しています。今後、Qwenからさらなる優れたAIモデルや技術が登場し、分野の発展に貢献することを期待しています。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles