Databricks推出DBRX：在开源AI竞争中强势挑战大科技巨头

Home AI News CN Databricks推出DBRX：在开源AI竞争中强势挑战大科技巨头

Databricks是一家快速发展的企业软件公司，近期推出了DBRX，这是一款开创性的开源人工智能模型，旨在重新定义AI的效率和性能标准。

DBRX拥有1320亿个参数，在语言理解、编程能力和数学技能等关键领域超越了Llama 2-70B和Mixtral等领先的开源模型。尽管在能力上无法与OpenAI的GPT-4相提并论，Databricks高管强调，DBRX是GPT-3.5的更高效、更加经济的替代方案。

Databricks首席执行官Ali Ghodsi在最近的新闻发布会上表示：“我们很高兴将DBRX推向全球，并推动开源AI的发展。虽然像GPT-4这样的模型是极好的通用工具，但我们的重点是创建定制模型，以深入理解客户的专有数据。DBRX是我们致力于这一使命的典范。”

在语言理解（MMLU）、编程（Human Eval）和数学（GSM 8K）的基准测试中，DBRX表现出色，尽管尚未超越GPT-4，但相较于常用的GPT-3.5，表现有了显著提升。

DBRX的一个显著特点是其创新的“专家混合”架构。与竞争对手不同，DBRX在生成每个词时并非同时使用所有参数，而是采用了16个专家子模型，仅针对每个标记激活四个相关的专家。该设计在任何时候仅利用360亿个参数，优化了性能，令操作更快速、更具成本效益。

Mosaic团队是Databricks去年收购的研究小组，基于其之前的Mega-MoE计划，开创了这种方法。“Mosaic团队已经掌握了高效训练基础AI模型的能力，”Ghodsi表示。“我们能够快速生成高质量的AI模型—DBRX的研发大约耗时两个月，投入约1000万美元。”

通过开源DBRX，Databricks希望在先进的AI研究领域树立领导地位，同时促进其创新架构的广泛采用。这一发布符合Databricks主要专注于构建和托管针对客户特定数据集的定制AI模型的目标。

如今，许多Databricks的客户仍依赖于OpenAI的GPT-3.5。然而，使用第三方模型处理敏感企业数据引发了安全隐患。“我们的客户信任我们管理全球范围内的受监管数据，”Ghodsi指出。“由于他们的数据已经在Databricks，DBRX为他们提供了先进的AI能力，同时确保数据安全。”

尽管DBRX并不直接与GPT-4竞争，但在语言理解、编程和数学基准测试中，DBRX显著超越GPT-3.5，成为一种具备竞争力的低成本开源替代方案。

DBRX的推出正值数据和AI平台领域竞争加剧之际，竞争对手Snowflake也推出类似功能，大型云服务提供商加强了生成式AI产品的投放。通过在高水平的开源研究中树立自身地位，Databricks寻求成为AI领域的领导者，吸引顶尖数据科学人才。此外，面对此前大科技公司提供的商业AI模型普遍受到怀疑，Databricks的发布正好契合了这一趋势。

DBRX的真正考验将在于其市场接受度及其为Databricks客户带来的价值。随着企业越来越希望利用AI并掌握专有数据的控制权，Databricks坚信其独特的尖端研究和强大的企业平台将使其在竞争中脱颖而出。

通过引入DBRX，Databricks向大型科技公司和开源竞争对手发起挑战，期待与之在创新领域一较高下。在日益激烈的AI竞争格局中，Databricks有望成为重要参与者。

人工智能推动创业成功：HubSpot研究显示86%的创始人感受到积极影响

Activeloop获得1100万美元融资，用于提升企业在AI应用中的多模态数据使用能力