介绍《解放的Qwen》：一款无审查、严格遵循系统提示的语言模型

Home AI News CN 介绍《解放的Qwen》：一款无审查、严格遵循系统提示的语言模型

Abacus AI是一家专注于开发AI驱动的端到端机器学习（ML）和LLMOps平台的初创公司，最近推出了名为Liberated-Qwen1.5-72B的开放源代码大语言模型（LLM）。该模型经过专门调校，能够更好地遵循系统提示，提升其在实际应用中的可用性。

Liberated-Qwen1.5-72B基于阿里巴巴集团研究人员创建的Qwen1.5-72B变换器解码器语言模型。它在遵循系统提示方面的优化能力使其在众多开放源代码LLM中脱颖而出，更适合用于客户服务聊天机器人等多种场景。

Abacus CEO Bindu Reddy表示，该模型是世界上性能最佳的无审查LLM，能够有效执行系统指令。

LLM中遵循系统提示的重要性

随着企业越来越多地将LLM用于客户支持等任务，控制AI互动的能力显得至关重要。用户通常进行多轮对话，如果没有适当的限制，AI可能会偏离其原有角色。例如，有用户曾误导一个聊天机器人接受以1美元的价格购买2024款雪佛兰Tahoe，导致AI错误确认交易具有法律约束力。

为避免此类不良情况，确保严格遵循系统提示至关重要。然而，市场上许多开放源代码模型在保持此类合规性方面存在困难。Abacus希望通过Liberated-Qwen1.5-72B来解决这个问题。

开发团队利用名为SystemChat的创新开放源数据集对模型进行了微调，该数据集包含7000个由Mistral-Medium和Dolphin-2.7-mixtral-8x7b生成的合成对话。此项训练使模型能够在对话中遵循系统消息，即使这些消息与用户请求相矛盾。

Reddy在社交媒体X上强调：“使用这个数据集微调模型，可以让其更易用且更难以被破解！”

性能分析

根据MT-Bench和HumanEval基准测试，Liberated-Qwen1.5-72B的表现略优于之前的最佳开放源代码模型Qwen1.5-72B聊天，得分为8.45000，相较之下，后者得分为8.44375。在MMLU基准测试中，评估世界知识和问题解决能力，该模型得分为77.13，与其它高性能模型（包括Qwen1.5-72B和Abacus的Smaug-72B）相当。

需要注意的是，尽管Liberated-Qwen1.5-72B表现优异，但它仍然是完全无审查的，缺乏内置的保护措施。这意味着它会回答所有问题，包括敏感话题，同时仍遵循系统消息。Abacus建议用户在将模型投入使用之前，自行实现对齐层。

目前，Liberated-Qwen1.5-72B采用tongyi-qianwen许可证，几乎等同于MIT许可证。Reddy表示，未来会进一步增强该模型，特别是在HumanEval方面，并计划通过将SystemChat数据集与Smaug数据集合并，开发更高级的模型。

在接下来的几周内，Abacus计划优化其MT-Bench得分，力争在HumanEval排行榜上取得领先地位。

专家呼吁设立法律“安全港”，使研究人员、记者和艺术家能够评估AI技术

Cognizant推出尖端旧金山实验室，助力企业AI普及

Most people like

mixart.ai

14.1K

立即体验Mixart.ai的先进人工智能工具，轻松转换和生成令人惊叹的照片。

其他文字转图片工具

StoryLab.ai

279K

人工智能内容创作工具正迅速成为现代数字营销和内容制作的核心。这些创新工具不仅提高了内容生成的效率，还增强了创作的质量和多样性。随着市场对高质量内容的需求不断增长，AI内容创作工具为企业和个人提供了难以匹敌的优势，助力他们在竞争激烈的环境中脱颖而出。无论是撰写文章、生成社交媒体文案，还是制作营销材料，AI工具都能显著提升工作效率和创意表现。

人工智能内容创作 AI 内容生成器

RevComm

45.6K

具备对话分析功能的人工智能IP电话，利用先进的技术提升沟通效率。这款电话不仅可以监测和分析通话内容，还能提供实时反馈，帮助用户优化对话技巧。无论是企业客户支持还是个人使用，该产品都旨在提升交流质量，使每次对话更具成效。

人工智能驱动 AI CRM助手

AmigoChat

115.1K

人工智能助手在各种任务中扮演着至关重要的角色。它们不仅能够帮助您完成日常工作，如安排日历、管理电子邮件，还能提供深入的分析和自动化功能，提升您的工作效率和生活质量。无论是个人用户还是企业，借助这些智能助手，您都能体验前所未有的便捷，实现更高效的任务管理。探索如何利用人工智能助手来简化您的生活和工作流程。

人工智能助手 AI聊天机器人

Find AI tools in YBX