Snowflake数据云扩展多模态大型语言模型(LLMs)功能
在Sridhar Ramaswamy的带领下,Snowflake数据云正在通过整合多模态大型语言模型(LLMs)来提升其能力。该公司与AI初创公司Reka合作,后者由前DeepMind、Google和Meta的研究人员创立,目的是将其专有模型引入Snowflake的数据平台。
这一合作紧随Snowflake与Mistral的合作之后,使得使用数据云的企业能够开发可处理文本、图像和视频的生成AI应用。这一整合为团队从数据集中提取新见解提供了新的可能性。
去年,Snowflake参与了Reka的6000万美元融资轮,但尚未确认是否会通过此次合作加大投资。Snowflake AI产品管理负责人Baris Gultekin表示,公司一直在努力支持合作伙伴和提升客户的创新能力,虽然并未透露具体投资细节。
在Snowflake Cortex中推出Reka Flash和Core
自推出以来,Snowflake致力于成为客户首选的数据基础设施。从最初提供基本数据仓库起,Snowflake逐渐支持多种数据格式和功能,发展成为一个包容各类AI和分析应用的全面数据云。
为了应对蓬勃发展的生成AI领域,Snowflake推出了Cortex,这是一个全面管理的服务,旨在开发LLM应用。Cortex为企业提供了一系列AI构建模块,包括开源的LLM,使其能够在安全的环境下分析数据并针对特定商业需求开发应用。该公司最初专注于情感分析等专用LLM,现已扩展至包括Reka的两个模型:Flash和Core。
Reka Flash是一种前沿模型,拥有210亿个参数,优化性能以与大型模型在语言和视觉基准上相媲美。而Core是Reka的最大模型,性能接近像GPT-4和Gemini Ultra这样的先进模型,目前尚未向公众开放。
Snowflake计划立即将Flash模型整合到Cortex中,而Core模型正在开发中,预计未来将推出。尽管Gultekin未提供时间表,但他表示该模型将很快可用,并提到根据需求可能会增加其他Reka模型。
多模态AI为Snowflake用户带来的好处
通过Cortex与Reka的AI模型的整合,Snowflake用户能够创建能够处理文本、图像和视频的生成AI应用。这一功能支持多种应用,如视频字幕生成、图像标记、生成电子商务产品描述以及图形数据分析。
Gultekin强调了几个潜在应用,包括能够解读图表的聊天机器人,以及利用视频和图像资产为娱乐行业生成市场营销内容。
虽然Gultekin没有透露具体使用Reka模型的公司数量,但他提到已有超过400家企业在利用Cortex及其托管模型开发生成AI应用。这些应用涵盖各个行业,从服务单中识别安全漏洞到改善医疗提供商与保险数据的沟通。
Reka模型的加入将使Cortex中可用的LLM总数增加到12个,近期还包括来自Mistral和Google的模型。
Gultekin形容Snowflake的AI创新进展正处于“超速”阶段,目标是使AI对所有用户都可访问,以迅速推动有意义的商业成果。他暗示将有更多AI进展的公告,直至六月的年会。
“我们的路线图反映了一个原则:有效的AI策略以健全的数据策略为基础——数据是AI的燃料。我们致力于提升生产力、协作和AI与机器学习工作流程的整体效率,所有这些都建立在Snowflake安全可靠的数据基础上,”Gultekin表示。
值得注意的是,数据生态系统中的竞争对手Databricks也在实施类似的方法。在收购MosaicML后,该公司推出了开放模型和改进构建生成AI应用的工具。最近,Databricks还收购了Lilac,一个专注于分析和优化非结构化数据以供AI训练的初创公司。