苹果推出OpenELM：开源语言模型助力设备AI开发

Home AI News CN 苹果推出OpenELM：开源语言模型助力设备AI开发

在人工智能领域，苹果公司近期推出了OpenELM，这是一系列开放源代码的大型语言模型（LLM），旨在直接在设备上运行，无需依赖云服务器。这一创新不仅巩固了苹果在人工智能领域的领导地位，也为自然语言处理的研究和应用带来了革命性的变化。

OpenELM的发布丰富了Hugging Face平台上的人工智能资源，为全球研究人员和开发者提供了一个协作与创新的空间。该系列包括八个模型版本：四个使用CoreNet库的预训练模型和四个针对特定应用场景进行微调的模型。

在开发OpenELM时，苹果采用了分层扩展策略，有效地将参数分布在每个变换器模型层中，从而显著提高了准确性。OpenELM拥有约十亿个参数，较OLMo模型的准确性提升了2.36%，同时减少了所需的预训练数据量。

值得一提的是，苹果在发布OpenELM的同时，也公开了模型的源代码、预训练权重、详细的训练日志、多重检查点以及预训练配置。这种开放的方式方便研究人员和开发者对模型进行重现和优化，加快了自然语言处理领域的进步。

苹果表示，发布OpenELM的目的是“赋能并丰富开放研究社区”，提供尖端语言模型，让研究人员能够探讨风险、数据和模型偏见。开发者和公司可以直接使用或修改这些模型，以满足不同的实际应用需求。

此外，这一开放源代码的举措也有助于吸引顶尖工程师、科学家和专家。透明的信息共享政策为研究人员提供了发表论文的机会，这一特权在苹果此前相对封闭的政策下是有限的。

尽管苹果尚未完全将其人工智能能力整合到设备中，但外界普遍期待iOS 18将引入多项新的人工智能功能。传言称，苹果计划直接在设备上运行其大型语言模型，以增强用户隐私，从而提供更流畅和安全的体验。

OpenELM的推出无疑为苹果在人工智能领域的发展奠定了坚实的基础。随着更多公司和研究机构参与这一开源项目，自然语言处理领域即将迎来更多创新和突破。通过拥抱开源倡议，苹果展现了推动技术进步和促进协作创新的决心。

54K

通过行为智能推动创新文化以及学习与发展策略的实现。

行为智能 AI客户服务助手

20.4K

智能助手：简化复杂PDF的全新解决方案

PDF阅读器其他

29.6K

AI 驱动的科研论文写作工具助力学术创作，提升论文质量与效率。通过智能化的功能，这些工具为研究人员提供了从文献综述到数据分析的全方位支持，帮助他们更高效地构思和撰写论文。无论是新手还是资深研究者，AI工具都能优化写作流程，助您在学术界脱颖而出。

研究论文写作工具写作助手

18.1K

探索使用AI导师来学习新语言的无限可能性。通过人工智能的帮助，您可以获得个性化的学习体验，随时随地提升语言能力。加入我们，了解如何利用先进的技术更有效地掌握外语，提高学习效率。

语言学习 AI文法检查器

Find AI tools in YBX