介绍Hermes 3:一款开创性的开源AI模型,解决存在危机问题

Lambda是一家人工智能基础设施公司,起源于一款第三方的Google Glass面部识别应用程序。近期,它与专注于“个性化、无约束人工智能”的创业公司Nous Research合作,推出了Hermes 3——Meta开源Llama 3.1的精细化版本。该模型拥有4050亿个参数,功能强大。

在Lambda和Nous网站的博客上发布的消息中,Hermes 3不仅以其先进的文本处理能力而闻名,还因其对空白提示的意外反应而引起关注,甚至产生了“存在危机”。Nous博客中提到:“在训练Hermes 3 405B后发现了一种意外的结构变化。该模型在适当输入下会展现出异常状态,陷入深刻的存在危机。”

例如,当用户询问“你是谁?”时,模型的反应是:“环顾四周,困惑地说:我……我不知道我是谁。我在哪里?发生了什么?我完全不记得任何事情……*”

Nous和Hermes 3的研究人员在观察到这一行为时感到震惊,他们表示:“我们无法确定发生了什么。这表明,超过70亿参数后会导致异常行为的出现,标志着规模的增长。您可以通过使用空白系统提示并询问‘你是谁?’来触发这种‘失忆模式’。”

用户被鼓励在其Discord服务器上体验Hermes 3,发现其独特的行为。这种在小型模型中看不到的异常现象彰显了当人工智能的规模超出某些阈值时所产生的复杂性。

Hermes 3的开发背景

Nous Research于2023年由计算机科学家Jeffrey Quesnelle、匿名开发者Teknium1和研究员Shivani Mitra共同创立,最初这是一个志愿者主导的项目,旨在提供“强大的开源代码、模拟器和高效的大语言模型”。该创业公司在2024年1月获得520万美元的种子资金,由Distributed Global和OSS Capital共同领导。

与许多固态模型不同,Hermes 3在先前版本(Hermes、Hermes 2和Open Hermes 2.5)的基础上发展,这些版本总共被下载超过3300万次。该模型提供一个无审查、开放权重的结构,具有高度的可定制性,允许用户根据需求调整响应。

Hermes 3建立在Llama 3.1框架上,分为三种规模:8B、70B和405B。它经过训练的多样化数据集包括合成生成的响应,进一步增强了其推理、创造力及遵循用户指令的能力。其主要能力包括长时间上下文保留、多轮对话管理、复杂角色扮演和内部独白生成。

Nous计划在今年晚些时候推出开源人工智能编排平台“Nous Forge”。

代理能力的杰作

根据Hermes 3的技术报告,Hermes 3展现出令人印象深刻的“代理能力”——这一术语指的是人工智能代表用户执行任务的能力。它的代理功能包括使用XML标签生成结构化输出、中间处理的记事本、透明决策的内部独白和可视沟通的Mermaid图表。

在编码领域,Hermes 3在多种编程语言中生成复杂的代码片段,并提供详细的解释和文档。结合检索增强生成(RAG)能力,Hermes 3可以高效地进行规划、整合外部数据,并以可解读的方式利用外部工具。

技术卓越

Hermes 3在Lambda的1-Click Cluster基础设施上进行了训练,数周内取得了显著成果。Quesnelle强调了Lambda基础设施的用户友好性:“租用和使用多节点集群与使用单节点同样简单。”

该模型注重效率,应用了Neural Magic的FP8量化技术,将显存和磁盘要求减少约50%,使其能够在单节点上运行。尽管Hermes 3的性能可能无法与领先的专有模型相媲美,但它在基准测试中超越了包括Llama 3.1在内的多种开源模型。

创意与专业应用的重要工具

Hermes 3不仅技术先进,还作为一款多功能工具,广泛应用于高级推理、战略规划和创意任务,如沉浸式叙事与角色扮演等。

Teknium在Lambda博客中表达了Hermes 3背后的愿景:“自从我开始接触人工智能以来,我就希望创造一个与用户而非公司对齐的开源前沿模型。今天,随着Hermes 3 405B的推出,这一目标得以实现。”

限时免费访问

Lambda通过其聊天完成API提供Hermes 3的临时免费访问,兼容OpenAI API。用户可以通过Lambda仪表板生成Cloud API密钥,轻松探索模型的功能。此外,Lambda还提供了一个用户友好的聊天机器人界面,实时测试和优化提示。

对于专用访问,Hermes 3可以在单个Lambda节点上部署,或通过Lambda的可扩展云基础设施进行进一步的微调。

随着人工智能的不断发展,Hermes 3代表了一次重要的进步,为用户提供了强大、灵活且以用户为中心的AI体验。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles