企业大型语言模型：小型灵活解决方案的明智选择

Home AI News CN 企业大型语言模型：小型灵活解决方案的明智选择

生成性人工智能的自然语言处理能力，得益于大型语言模型（LLM），使人工智能在公众视野中占据了重要位置。这些庞大的模型可能代表了我们时代最重大的进步之一。当前，许多开源LLM的出现推动了数千种针对特定领域的LLM为企业的开发。

基于LLM的人工智能服务可以自动化常规任务，作为生产力助手。然而，要让人工智能能够解决复杂的挑战、增强组织的核心使命，并个性化消费者体验，LLM需要变得更加专门化。许多行业专家一致认为，大多数组织的人工智能服务将由灵活的专业模型提供，这些模型将在现有的企业IT、边缘计算和客户端基础设施上运行。

LLM是否提供竞争优势？

拥有数百亿参数的LLM在大规模数据上进行训练，利用数据中心级集群，结果是云服务供应商或人工智能服务公司提供的多功能AI平台。这类模型的开发成本高达数亿，持续的运营费用达到千万级。这些大型模型擅长从公开可用的数据生成通用的、非专有的结果。由于大部分组织通过API调用使用类似的生成性AI服务，唯一的优势在于能够跟上竞争。

为了创造独特的产品和服务，提高客户参与度，并提升成本效率，组织需要准确的、及时的专门模型，利用领域特定的私密数据进行训练。这不仅可以防止错误和偏见，还可保护公司的声誉。使用案例的复杂性与模型的精确性直接相关，这突显了整合专有数据的重要性。大型模型在执行关键任务的企业应用中可能显得笨重和低效，因此更小、更灵活的模型成为更受欢迎的选择。

值得庆幸的是，已有开源的预训练小型LLM，其规模比大型模型小10倍到100倍，但依然保持高准确度。这些小型模型可以借助检索增强生成（RAG）方法，使用私密数据迅速进行微调，打造适合特定业务需求的可靠专家模型。组织现在可以在午餐时间开发模型并在现有服务器上部署，从而避免了大型模型带来的时间和成本负担。这种方法对各类应用的人工智能扩展而言，既可持续又经济。

大型基础AI模型与服务：

- 优势：出色的多功能性、引人注目的结果、通过API快速集成、支持大规模数据集。

- 劣势：管理复杂、训练和维护成本高、可能存在幻觉和偏见、安全隐忧、数据源未知。

小型语言模型生态：

- 优势：体积小且准确性高、数据隐私和安全性增强、可解释性好、微调和部署成本低廉。

- 劣势：需要少量样本微调、需索引源数据、任务范围减小。

企业为何需要自行管理LLM

大多数组织将利用API服务处理常规任务，同时采用私有人工智能模型处理业务特定案例。在决定自主管理哪些AI模型时，需要考虑以下几点：

- 数据隐私：保护敏感信息，同时获得竞争优势，确保遵守数据治理规定。

- 准确性：确保关键应用的可靠性，以维护声誉。

- 可解释性：在做出重大决策前，可以追溯结果的数据来源，持续监测结果的一致性。

- 成本：在现有IT基础设施上自发运行的持久模型通常更为经济。

- 数据接近性：将模型与应用放置在一起，以确保迅速响应。

- 整合：在现有的业务逻辑和IT决策系统中无缝部署。

了解您的需求和模型选择

人工智能常常被错误地视为单一应用程序，彼此之间相互竞争。然而，我们相信，人工智能最终将成为每个应用程序的核心功能，依托于现有的IT基础设施。了解您的数据、使用案例需求以及人工智能模型选项是成功实施的关键。虽然一些数据量大且任务独特的企业可能希望开发自己的大型语言模型，但大多数企业将在客户服务或订单处理等任务中从灵活的开源模型中受益。

人工智能的快速发展要求加速计算以满足应用需求。模型将来源于开源生态，利用私密数据进行微调，或与商业软件集成。为实现生产就绪的人工智能应用，涉及的数据摄取、存储、处理、推理服务、验证和监控的工作远不止于LLM本身。因此，计算平台必须支持数据准备、模型构建和部署。

Intel提供端到端的人工智能平台，包括优化性价比的Intel® Gaudi®加速器，性能显著，报告显示每美元的性能是Nvidia H100的四倍，以及具有内置人工智能功能的第五代Intel® Xeon®通用CPU，适用于小型LLM及其他AI工作负载。

- 模型：为Hugging Face、GitHub和Gaudi开发者中心等平台上的数千个模型提供自动化模型配方和优化。

- 软件：Intel® Gaudi®软件和Intel AI软件套件，经过400多个AI模型的行业标准框架验证。

- 企业级：在Xeon基础的OEM服务器上，依据VMware Private AI和Red Hat OpenShift进行了生产验证的微调AI模型。

您的生成性AI旅程现在开始

企业的旅程始于识别业务用例，无论是通过优化操作实现成本节省、通过增强客户体验增加收入，还是消除平淡任务以提高员工满意度。开发者应从开源LLM或特定用例模型入手，确保了解数据要求并拥有适当的软件工具，以实现最佳的性价比和易用性。

探索Intel在Hugging Face上的开源生成性AI模型，开启您的生成性AI之旅。

雪花公司任命Neeva联合创始人为首席执行官，抓住人工智能机遇

Nvidia、Hugging Face与ServiceNow联手推出StarCoder2 LLM，提升代码生成能力