介绍《解放的Qwen》：一款无审查、严格遵循系统提示的语言模型

Home AI News CN 介绍《解放的Qwen》：一款无审查、严格遵循系统提示的语言模型

Abacus AI是一家专注于开发AI驱动的端到端机器学习（ML）和LLMOps平台的初创公司，最近推出了名为Liberated-Qwen1.5-72B的开放源代码大语言模型（LLM）。该模型经过专门调校，能够更好地遵循系统提示，提升其在实际应用中的可用性。

Liberated-Qwen1.5-72B基于阿里巴巴集团研究人员创建的Qwen1.5-72B变换器解码器语言模型。它在遵循系统提示方面的优化能力使其在众多开放源代码LLM中脱颖而出，更适合用于客户服务聊天机器人等多种场景。

Abacus CEO Bindu Reddy表示，该模型是世界上性能最佳的无审查LLM，能够有效执行系统指令。

LLM中遵循系统提示的重要性

随着企业越来越多地将LLM用于客户支持等任务，控制AI互动的能力显得至关重要。用户通常进行多轮对话，如果没有适当的限制，AI可能会偏离其原有角色。例如，有用户曾误导一个聊天机器人接受以1美元的价格购买2024款雪佛兰Tahoe，导致AI错误确认交易具有法律约束力。

为避免此类不良情况，确保严格遵循系统提示至关重要。然而，市场上许多开放源代码模型在保持此类合规性方面存在困难。Abacus希望通过Liberated-Qwen1.5-72B来解决这个问题。

开发团队利用名为SystemChat的创新开放源数据集对模型进行了微调，该数据集包含7000个由Mistral-Medium和Dolphin-2.7-mixtral-8x7b生成的合成对话。此项训练使模型能够在对话中遵循系统消息，即使这些消息与用户请求相矛盾。

Reddy在社交媒体X上强调：“使用这个数据集微调模型，可以让其更易用且更难以被破解！”

性能分析

根据MT-Bench和HumanEval基准测试，Liberated-Qwen1.5-72B的表现略优于之前的最佳开放源代码模型Qwen1.5-72B聊天，得分为8.45000，相较之下，后者得分为8.44375。在MMLU基准测试中，评估世界知识和问题解决能力，该模型得分为77.13，与其它高性能模型（包括Qwen1.5-72B和Abacus的Smaug-72B）相当。

需要注意的是，尽管Liberated-Qwen1.5-72B表现优异，但它仍然是完全无审查的，缺乏内置的保护措施。这意味着它会回答所有问题，包括敏感话题，同时仍遵循系统消息。Abacus建议用户在将模型投入使用之前，自行实现对齐层。

目前，Liberated-Qwen1.5-72B采用tongyi-qianwen许可证，几乎等同于MIT许可证。Reddy表示，未来会进一步增强该模型，特别是在HumanEval方面，并计划通过将SystemChat数据集与Smaug数据集合并，开发更高级的模型。

在接下来的几周内，Abacus计划优化其MT-Bench得分，力争在HumanEval排行榜上取得领先地位。

专家呼吁设立法律“安全港”，使研究人员、记者和艺术家能够评估AI技术

Cognizant推出尖端旧金山实验室，助力企业AI普及

Most people like

BRIA.ai

36.1K

借助BRIA的生成人工智能技术，您可以更迅速、更高效地打造个性化的视觉内容。

视觉生成型人工智能 AI 内容生成器

Beam AI

21.9K

AI驱动的用户友好型云端建筑工程量清单软件，能够节省高达90%的编制时间，并支持超过30%的估算处理。这款软件简化了建筑工程的量清单流程，让用户高效、轻松完成项目估算。

建设 AI产品描述生成器

知乎直答

知乎直答是知乎推出的AI搜索产品，旨在帮助用户更好地 “用提问发现世界”。用户可以在线提问任何问题，并得到生成的答案。

问答 AI搜索引擎

31Memorize

36.1K

提升您的英语词汇学习体验在如今快速发展的数字时代，词汇的掌握对英语学习至关重要。智能英语词汇学习不仅能帮助您扩展词汇量，还能提高您的语言应用能力。本课程结合最新的智能技术，为学习者提供个性化和互动性的学习方式，让学习既有效又有趣。无论您是初学者还是希望提升您的英语水平，这个学习工具都将为您提供坚实的基础及全面的支持。

英语词汇 AI搜索引擎

Find AI tools in YBX