阿里巴巴发布开源Qwen 1.5-110B模型，性能媲美Meta的Llama 3-70B

Home AI News CN 阿里巴巴发布开源Qwen 1.5-110B模型，性能媲美Meta的Llama 3-70B

最近，阿里巴巴宣布开源其首个1100亿参数模型Qwen1.5-110B，标志着Qwen1.5系列的重要进展。此举不仅展示了阿里巴巴在人工智能领域的创新能力，也凸显了中国企业在大型语言模型开发方面的显著进步。

Qwen1.5-110B模型采用Transformer解码器架构，并引入了分组查询注意力（GQA）技术，提升了推理效率。该模型支持最长32,000个标记的上下文并能够处理多种语言，包括英语、中文、法语、西班牙语、德语、俄语、日语、韩语和越南语。

性能评估显示，Qwen1.5-110B在与Meta的Llama3-70B的竞争中表现突出，这一成绩得益于其更大的规模，以及在预训练方法上没有进行重大调整。阿里巴巴认为，模型性能的提升主要得益于其扩展程度，这反映了公司在模型设计和优化上的深厚技术实力，为中国大型语言模型的发展注入了新活力。

此外，Qwen1.5-110B在对话评测中表现优异，在MT-Bench与AlpacaEval 2.0评估中显著超越了之前的72B模型，进一步证明更大的基础语言模型能够显著提高对话模型的表现。

阿里巴巴强调，Qwen1.5-110B是该系列中最大的模型，也是首个超过1000亿参数的模型。这一成就巩固了阿里巴巴在大型语言模型领域的领先地位，同时增强了中国企业在全球人工智能领域的声音。

随着人工智能技术的不断进步，大型语言模型已成为众多科技公司的重点关注方向。Qwen1.5-110B的开源发布为开发者提供了卓越的工具，推动了人工智能技术的普及与应用。

展望未来，我们期待看到中国企业在大型语言模型领域取得更多突破，借助创新思维丰富人工智能技术的发展。

46.1K

提升专注力的免费音乐应用推荐

专注音乐应用 AI音乐生成器

11.2K

最佳AI聚合网站，适用于各种任务

人工智能工具 AI工具导航

36.8K

Followr是一款利用人工智能技术进行自动化社交媒体管理的平台，旨在帮助用户节省时间并提升效率。

人工智能驱动 AI广告助手

64.6K

AI思维导图软件是一种强大的工具，旨在帮助用户以可视化方式整理和呈现思维与创意。

思维导图人工智能脑图

Find AI tools in YBX