数据对于现代人工智能(AI)系统至关重要,但为复杂工作负载提供数据依然面临挑战。专注于解决此问题的初创公司 Weka 最近宣布完成了 1.4 亿美元的 E 轮融资,背后主要是客户需求的推动。此次融资全部来自现有投资者,使 Weka 的估值跃升至 16 亿美元,是 2022 年 11 月估值的两倍。
Weka 总裁乔纳森·马丁表示:“很少有人预测 AI 市场会快速增长……但当生成式 AI 在 2022 年 12 月迅猛发展时,企业和研究机构纷纷寻求加快 AI 项目的进展,导致对 Weka 数据平台的需求激增。”
此次融资将主要用于提升 Weka 的平台,这是一种旨在消除因旧有架构而导致的数据瓶颈的软件解决方案。该平台建立了一个“动态数据管道”,能够持续向 GPU 和 AI 工作负载提供数据,从而提高效率和可持续性。
Weka 的创新解决方案
尽管企业领导者对生成式 AI 等现代工作负载表现出较高的承诺,但团队常常因数据孤岛和旧系统中的空白而陷入困境。传统的生成式 AI 管道通常涉及多个数据复制步骤,这些步骤形成瓶颈,延缓训练过程并增加能耗。
成立于 2013 年的 Weka 通过其“动态数据管道”来应对这些挑战。该公司平台采用独特的无复制架构,加速 AI 管道的每个阶段,确保 GPU 始终能获取数据。这种方式使得模型训练更快、更高效,从而产生快速的洞察和改善的业务结果。
马丁解释道:“通过简化针对高需求 AI 和 GPU 密集型过程的 IT 堆栈,Weka 使客户能够更快、更低成本地进入市场。我们的性能提升也为 GPU 服务器操作带来了显著的节能效果,这使 Weka 成为大型 AI 项目的可持续选择。”
Weka 数据平台的核心是 WekaFS,这是一种可扩展的共享并行文件系统,直接与 PCIe 连接的 NVMe 驱动器接口。它可适应各种数据类型和大小,性能是传统网络附加存储(NAS)的 10 倍,地方服务器存储的 3 倍。
马丁补充说:“Weka 数据平台非常适合数据需求复杂的企业,包括大型公司、云服务提供商、研究机构、媒体公司、AI/ML 初创企业、物联网应用和金融服务公司,这些公司都在进行 AI、ML、高性能计算(HPC)和视觉特效(VFX)等性能密集型工作负载的部署。”
在可持续性方面,马丁表示,通过动态管道提升 GPU 利用率,每存储一拍字节的数据,客户可以节省 260 吨二氧化碳当量(CO2e)。
显著增长与战略展望
自 ChatGPT 诞生以来,生成式 AI 领域经历了显著变化,Weka 一直做好了准备。该公司不仅适应市场需求,更主动与寻求其解决方案的客户展开合作。
“我们设计的企业数据堆栈旨在满足现代性能密集型工作负载(如 AI/ML)的速度、规模、简便和可持续性需求。我们不仅对这一转变做好了准备,而且走在了前面,”马丁说道。
Weka 目前为超过 300 家客户服务,包括 12 家《财富》50 强公司。利用 Weka 平台的知名 AI 公司包括 Stability AI、Midjourney 和 ElevenLabs,以及 GPU 云服务提供商如 Iris Energy、Applied Digital 和 Yotta。该公司的软件订阅模型年常规收入同比翻了一番,超过 1 亿美元,预计在当前财年内将达到三倍或四倍的增长。
凭借这笔融资,Weka 将加强现金储备并扩大运营,以应对生成式 AI 热潮后日益增长的 AI 基础设施需求。这将包括对研发、平台提升和客户成功计划的投资。该公司预计到本财年末,其 400 名员工的团队规模将至少增长 25%。Weka 在分布式文件系统领域的主要竞争对手包括 VAST Data、Nutanix、IBM、戴尔科技、Qumulo 和 Pure Storage。