开创性开源语言模型Smaug-72B登顶全球最佳榜单
根据领先的自然语言处理(NLP)研究和应用平台Hugging Face的最新排名,一款名为“Smaug-72B”的开源语言模型已被评为全球最佳。该模型由专注于人工智能和机器学习解决复杂问题的初创公司Abacus AI于今日公开发布。Smaug-72B是新近推出的“Qwen-72B”的精细调优版本,后者由阿里巴巴集团的研究团队在数月前推出。
Smaug-72B在多项关键基准测试中超越了OpenAI的GPT-3.5和Mistral Medium两款先进的专有语言模型,并在许多评估中显著超过了Qwen-72B。
根据Hugging Face的开放大语言模型(LLM)排行榜,Smaug-72B是唯一一个在所有主要评估中的平均分超过80的开源模型。尽管尚未达到90-100分的人类性能水平,但它的发布预示着开源AI领域可能会发生重要变革,表明它可能很快就能与长期被视为难以接近的大型科技公司的能力相媲美。
开源的优势
“Abacus AI的Smaug-72B现已在LLM排行榜上领跑,成为首个平均分达到80的模型,”Abacus AI CEO Bindu Reddy在X.com上表示。“我们的下一个目标是将这些技术提交为研究论文,并将其应用于顶级的Mistral模型,包括70B参数的LLama-2的精细调优版本Miqu。我们采用的技术特别针对推理和数学能力,从而取得了优异的GSM8K分数!我们将在即将发布的论文中提供更多见解。”
自发布以来,Smaug-72B因其全面表现及突出推理和数学任务能力而受到关注,这一切得益于Abacus AI所应用的特定精细调优技术。这些技术解决了大型语言模型的常见弱点,提升了其性能。
另外,值得注意的开源发展还有Qwen 1.5,这是一个包含0.5B到72B参数的小型强大语言模型的系列,超越了流行的专有模型如Mistral Medium和GPT-3.5,具备32k上下文长度且兼容多种工具,以便进行快速本地推理。此外,Qwen还推出了新一代大型视觉语言模型Qwen-VL-Max,与Google的Gemini Ultra和OpenAI的GPT-4V竞争。
人工智能的未来影响
Smaug-72B和Qwen 1.5的崛起激发了AI社区和更广泛科技圈的热议。许多专家对Abacus AI和Qwen在开源AI领域的贡献表示赞赏,强调过去一年所取得的快速进展。
“想不到不到一年前,我们还在为像Dolly这样的模型欢呼,” AI影响者和分析师Sahar Mor在LinkedIn上说,反映了开源模型的迅速进展。
Smaug-72B和Qwen 1.5现已在Hugging Face上公开访问,用户可以自由下载、使用和修改。这两家公司还计划将其模型提交至llmsys的人类评估排行榜,这是一个旨在衡量语言模型在人类任务中的表现的新指标。他们还暗示将推出更多开源模型和探索多样化应用的未来项目。
Smaug-72B和Qwen 1.5体现了近期开源AI的快速演变,标志着创新和民主化的变革浪潮,挑战大型科技公司的主导地位,拓宽了开发者和研究者的机会。尽管Smaug-72B在Hugging Face排行榜上的领导地位仍待观察,但显然,开源AI正在获得显著的推动力。