为何Writer's Palmyra LLM是企业变革的强大AI模型

Writer是一家成立于2020年的旧金山初创公司,在2023年9月成功筹集了1亿美元,以扩大其企业应用的专有大型语言模型(LLMs)。尽管不如OpenAI、Anthropic或Meta等公司知名,Writer凭借其内部开发的Palmyra系列模型在市场上寻求发展。包括埃森哲、先锋集团、HubSpot和Pinterest在内的知名企业都在利用这个平台的创造力和生产力。

最近,斯坦福大学人工智能研究所(Stanford HAI)推出了一种新的基准衡量指标,称为HELM Lite,它增加了上下文学习的功能,使LLMs能够从推理过程中给出的少量示例中学习任务。值得注意的是,尽管GPT-4在这一基准测试中表现突出,Writer的Palmyra X V2和X V3模型也表现“出乎意料”地良好,尽管它们的规模较小,排名依然很高。斯坦福中心主任佩西·梁(Percy Liang)对此表示认可。

在机器翻译领域,Palmyra表现优异,获得了最高排名。CEO梅·哈比布(May Habib)在LinkedIn上强调了这一成就,指出“Palmyra X在经典基准测试中超越表现,整体在MMLU中获得了最高位置,并在新的翻译测试中领先。”

哈比布强调,企业在实施如GPT-4这样的大型模型时面临经济挑战,并指出“2024年的生成AI应用需要具备经济可行性”,解释说企业常常因模型精简导致高昂的服务成本和频繁变更的提示而苦恼。她认为,斯坦福教育的基准测试比Hugging Face等其他平台更准确地反映了企业的实际需求。

Writer最初针对市场营销团队,由哈比布和前Qordoba自然语言处理及机器翻译公司经理Waseem AlShikh共同创办。在2023年初,Writer发布了Palmyra系列,包括具有从1.28亿到200亿参数不等的模型,并推出了知识图谱,帮助企业将业务数据与Palmyra整合,并自我托管模型。

“我们提供完整的解决方案,将模型与内置的检索增强生成(RAG)系统相结合,”哈比布表示。这一创新解决了将数据发送至嵌入模型再返回的低效率问题。

尽管一些专家认为大型通用模型的表现优于专用模型,哈比布依然提倡使用较小的模型,并结合精心策划的训练数据。她指出,HELM Lite排行榜显示医疗领域的LLMs表现优于GPT-4,并强调“在推理和成本方面,企业受益于更容易管理且更具经济性的专用模型。”

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles