介绍《解放的Qwen》:一款无审查、严格遵循系统提示的语言模型

Abacus AI是一家专注于开发AI驱动的端到端机器学习(ML)和LLMOps平台的初创公司,最近推出了名为Liberated-Qwen1.5-72B的开放源代码大语言模型(LLM)。该模型经过专门调校,能够更好地遵循系统提示,提升其在实际应用中的可用性。

Liberated-Qwen1.5-72B基于阿里巴巴集团研究人员创建的Qwen1.5-72B变换器解码器语言模型。它在遵循系统提示方面的优化能力使其在众多开放源代码LLM中脱颖而出,更适合用于客户服务聊天机器人等多种场景。

Abacus CEO Bindu Reddy表示,该模型是世界上性能最佳的无审查LLM,能够有效执行系统指令。

LLM中遵循系统提示的重要性

随着企业越来越多地将LLM用于客户支持等任务,控制AI互动的能力显得至关重要。用户通常进行多轮对话,如果没有适当的限制,AI可能会偏离其原有角色。例如,有用户曾误导一个聊天机器人接受以1美元的价格购买2024款雪佛兰Tahoe,导致AI错误确认交易具有法律约束力。

为避免此类不良情况,确保严格遵循系统提示至关重要。然而,市场上许多开放源代码模型在保持此类合规性方面存在困难。Abacus希望通过Liberated-Qwen1.5-72B来解决这个问题。

开发团队利用名为SystemChat的创新开放源数据集对模型进行了微调,该数据集包含7000个由Mistral-Medium和Dolphin-2.7-mixtral-8x7b生成的合成对话。此项训练使模型能够在对话中遵循系统消息,即使这些消息与用户请求相矛盾。

Reddy在社交媒体X上强调:“使用这个数据集微调模型,可以让其更易用且更难以被破解!”

性能分析

根据MT-Bench和HumanEval基准测试,Liberated-Qwen1.5-72B的表现略优于之前的最佳开放源代码模型Qwen1.5-72B聊天,得分为8.45000,相较之下,后者得分为8.44375。在MMLU基准测试中,评估世界知识和问题解决能力,该模型得分为77.13,与其它高性能模型(包括Qwen1.5-72B和Abacus的Smaug-72B)相当。

需要注意的是,尽管Liberated-Qwen1.5-72B表现优异,但它仍然是完全无审查的,缺乏内置的保护措施。这意味着它会回答所有问题,包括敏感话题,同时仍遵循系统消息。Abacus建议用户在将模型投入使用之前,自行实现对齐层。

目前,Liberated-Qwen1.5-72B采用tongyi-qianwen许可证,几乎等同于MIT许可证。Reddy表示,未来会进一步增强该模型,特别是在HumanEval方面,并计划通过将SystemChat数据集与Smaug数据集合并,开发更高级的模型。

在接下来的几周内,Abacus计划优化其MT-Bench得分,力争在HumanEval排行榜上取得领先地位。

Most people like

Find AI tools in YBX