Databricks是一家快速发展的企业软件公司,近期推出了DBRX,这是一款开创性的开源人工智能模型,旨在重新定义AI的效率和性能标准。
DBRX拥有1320亿个参数,在语言理解、编程能力和数学技能等关键领域超越了Llama 2-70B和Mixtral等领先的开源模型。尽管在能力上无法与OpenAI的GPT-4相提并论,Databricks高管强调,DBRX是GPT-3.5的更高效、更加经济的替代方案。
Databricks首席执行官Ali Ghodsi在最近的新闻发布会上表示:“我们很高兴将DBRX推向全球,并推动开源AI的发展。虽然像GPT-4这样的模型是极好的通用工具,但我们的重点是创建定制模型,以深入理解客户的专有数据。DBRX是我们致力于这一使命的典范。”
在语言理解(MMLU)、编程(Human Eval)和数学(GSM 8K)的基准测试中,DBRX表现出色,尽管尚未超越GPT-4,但相较于常用的GPT-3.5,表现有了显著提升。
DBRX的一个显著特点是其创新的“专家混合”架构。与竞争对手不同,DBRX在生成每个词时并非同时使用所有参数,而是采用了16个专家子模型,仅针对每个标记激活四个相关的专家。该设计在任何时候仅利用360亿个参数,优化了性能,令操作更快速、更具成本效益。
Mosaic团队是Databricks去年收购的研究小组,基于其之前的Mega-MoE计划,开创了这种方法。“Mosaic团队已经掌握了高效训练基础AI模型的能力,”Ghodsi表示。“我们能够快速生成高质量的AI模型—DBRX的研发大约耗时两个月,投入约1000万美元。”
通过开源DBRX,Databricks希望在先进的AI研究领域树立领导地位,同时促进其创新架构的广泛采用。这一发布符合Databricks主要专注于构建和托管针对客户特定数据集的定制AI模型的目标。
如今,许多Databricks的客户仍依赖于OpenAI的GPT-3.5。然而,使用第三方模型处理敏感企业数据引发了安全隐患。“我们的客户信任我们管理全球范围内的受监管数据,”Ghodsi指出。“由于他们的数据已经在Databricks,DBRX为他们提供了先进的AI能力,同时确保数据安全。”
尽管DBRX并不直接与GPT-4竞争,但在语言理解、编程和数学基准测试中,DBRX显著超越GPT-3.5,成为一种具备竞争力的低成本开源替代方案。
DBRX的推出正值数据和AI平台领域竞争加剧之际,竞争对手Snowflake也推出类似功能,大型云服务提供商加强了生成式AI产品的投放。通过在高水平的开源研究中树立自身地位,Databricks寻求成为AI领域的领导者,吸引顶尖数据科学人才。此外,面对此前大科技公司提供的商业AI模型普遍受到怀疑,Databricks的发布正好契合了这一趋势。
DBRX的真正考验将在于其市场接受度及其为Databricks客户带来的价值。随着企业越来越希望利用AI并掌握专有数据的控制权,Databricks坚信其独特的尖端研究和强大的企业平台将使其在竞争中脱颖而出。
通过引入DBRX,Databricks向大型科技公司和开源竞争对手发起挑战,期待与之在创新领域一较高下。在日益激烈的AI竞争格局中,Databricks有望成为重要参与者。