每年,Snowflake 举办 数据云峰会,展示其平台在数据资产管理方面的最新进展。同时,该峰会还帮助各团队有效利用数据资源。在2024年,峰会的重点是如何赋能团队使用其数据构建强大的人工智能应用。
Snowflake 首席执行官 Sridhar Ramaswamy 领导下宣布了多项创新的人工智能功能和合作伙伴关系,同时推出了备受期待的特性,旨在增强平台的数据基础。主要亮点包括冰山表(Iceberg Tables)和内部市场的普遍可用性。
2024年 Snowflake 数据云峰会的主要公告:
1. 冰山表与极光目录
雪花公司首次全面推出冰山表,提供企业级完整存储互操作性。这些表的功能类似于本地 Snowflake 表,但其元数据以 Apache Iceberg 格式存储在客户提供的存储空间中。这一创新提升了 Snowflake 在外部存储冰山数据时的可用性、性能、治理和协作能力。此外,新推出的极光(Polaris)开放数据目录,方便对开源表格式的数据进行索引和组织,并支持与包括 Apache Flink、Apache Spark、Dremio、Python 和 Trino 在内的各种查询引擎的互操作性。
2. Cortex AI 和 Snowflake ML 的升级
Cortex AI 是 Snowflake 提供的完全托管的大语言模型(LLM)应用构建服务,近期进行了重大升级,新增无代码的 AI & ML 工作室,便于快速构建应用。新功能包括分析师与搜索功能,支持开发 LLM 聊天机器人和提升检索生成(RAG)应用。同时,Cortex Guard 将确保聊天机器人不产生有害内容,Snowflake ML 的 MLOps 功能也得到了增强。
3. Snowflake Horizon 新市场
Snowflake 推出了 Horizon,新增合规、安全、隐私和数据治理功能,并推出了新的内部市场。该市场允许用户为团队定制并发布数据产品,同时控制对敏感内容的访问。它支持共享 AI 模型、冰山表和动态表,同时利用 AI 强化对象描述,提高数据发现效率。
4. Snowflake Trail 观察工具
Snowflake 推出 Trail,这是一款提高数据质量、管道和应用程序可见性的观察工具。Trail 提供 Snowpark 和 Snowpark Container Services 的遥测信号,使用户能够轻松诊断和调试错误,而无需手动转移数据。它基于 OpenTelemetry 标准,与 Datadog、Grafana、Metaplane、PagerDuty 和 Slack 等观察平台无缝集成。
5. 增强的数据驻留
Snowflake 宣布在受监管和主权市场展开扩展,包括设立新的 EU 专属数据边界,以提升数据驻留能力,帮助客户遵守相关法规。同时,为国防部客户提供的专用环境将增强安全性,并与边界云接入点(BCAP)进行网络集成。
6. 与 NVIDIA 合作
Snowflake 与 NVIDIA 建立合作伙伴关系,采用 NVIDIA AI Enterprise 软件,并将 NeMo Retriever 微服务集成到 Cortex AI 中。这一合作使公司能够将自定义模型与业务数据连接,从而实现更准确的响应。开放的 LLM Arctic 支持 NVIDIA TensorRT-LLM 软件,优化性能和可访问性,借助 NVIDIA NIM 推理微服务实现。
2024 年 Snowflake 数据云峰会将于 6 月 3 日至 6 月 6 日举行。