DeepInfra从隐形阶段正式启动,获800万美元融资以降低AI推理成本

解锁生成性人工智能:商业领袖指南

作为公司领袖或IT决策者,您可能已被关于生成性人工智能(AI)的讨论所淹没。如果您准备为员工或客户实施大型语言模型(LLM)聊天机器人,您面临一个重要问题:如何启动此项目,以及预期的成本是多少?

深度基础架构的介绍

深度基础架构(DeepInfra)由前IMO Messenger工程师创立,旨在简化商业领袖的这一过程。该公司以每百万个令牌仅需1美元的价格在私有服务器上部署模型,远低于OpenAI的GPT-4 Turbo(10美元)和Anthropic的Claude 2(11.02美元)。

深度基础架构近期从隐秘状态中推出,并宣布获得800万美元的种子轮融资,由A.Capital和Felicis主导。其专注于提供一系列开源模型推理,包括Meta的Llama 2和CodeLlama,以及这些模型的定制版本。

深度基础架构的价值主张

尽管大量关注了训练LLM所需的GPU资源,但为可靠性能提供充足计算能力(推理)的重要性也不容忽视。CEO Nikola Borisov表示,真正的挑战在于高效地为多个同时用户提供服务。

“关键在于管理多个用户同时访问服务器。每个模型生成的令牌都需要大量计算和内存带宽,”Borisov解释道。为了确保最佳性能,企业必须专注于最大化效率,以防止服务器因冗余计算任务而过载。

深度基础架构的创始人凭借其在全球管理大规模服务器群的丰富经验,有效应对这些挑战。

顶级投资者的认可

Borisov和他的联合创始人因编程能力而备受赞誉。著名企业家和Felicis管理合伙人Aydin Senkut称赞他们的能力,表示:“他们拥有令人难以置信的经验,可能仅次于WhatsApp团队,在构建服务数亿用户的高效基础设施方面。”

这种基础设施的高效性使得深度基础架构能够以更低的成本提供服务,适应企业面临日益上升的AI开支的环境。Senkut指出,“如果一家公司在AI上实现10倍的成本优势,就能显著颠覆市场。”

面向中小企业的开源AI解决方案

深度基础架构的初步重点是希望以实惠价格获取先进开源语言和机器学习模型的小型和中型企业(SMB)。Borisov表示:“我们的目标客户希望以合理的成本可靠地访问顶级模型。”

该公司密切关注开源AI社区的发展,随时准备采纳专门针对文本生成、计算机视觉和编码等多种任务的新兴模型。Borisov相信开源解决方案的持续增长和多样性:“随着Llama等模型的发布,许多人将创造其变种,所需计算量极小,推动协作生态系统。”

隐私与安全

深度基础架构的推理托管服务尤其吸引注重数据隐私的企业。Borisov保证:“我们不会存储或使用任何提交的提示;用户会话结束后,这些信息即被丢弃。”他强调了对隐私的承诺。

通过利用深度基础架构的服务,企业可以高效、经济地应对生成性AI解决方案的复杂性,确保在快速发展的环境中保持竞争力。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles