Deci发布创新AI开发平台及紧凑型Deci Nano模型

在OpenAI相对安静的时期,竞争对手Anthropic发布了其Claude 3系列大型语言模型(LLM),引发关注。另一个值得关注的是以色列初创公司Deci,最近宣布了其产品的重大更新。

在2023年秋季,Deci首次推出了DeciDiffusion和DeciLM 6B这两个开源模型,分别是Stability的Stable Diffusion 1.5和Meta的LLaMA 2 7B的精细调优版本。此后,Deci还推出了DeciCoder,一个用于代码补全的LLM,和改进版的DeciDiffusion 2.0。最近,该公司发布了Deci-Nano,这是一个体积更小、效率更高的闭源LLM,目前仅在Deci生成性人工智能开发平台上提供,主要面向企业和开发者。

转向商业模式?

Deci似乎正在向更商业化的策略转变,类似于Mistral与微软的合作。这引发了对开源人工智能未来的疑问。Deci的市场副总裁Rachel Salkin在邮件中表示:“我们仍然致力于支持开源社区,但也意识到闭源模型在提高准确性和速度方面的价值,能够为客户提供更大的价值。”

Salkin还强调了最近发布的几款开源模型——包括DeciLM-6B、DeciLM-7B和DeciCoder——尽管它们的演示空间暂时暂停,下载量仍然可观。

性能与价格的竞争力

如果Deci确实正在走向商业道路,Deci-Nano就是一个显著的第一步。该模型在语言理解和推理上表现出色,在NVIDIA A100 GPU上仅用4.56秒便完成256个tokens的处理。Deci的博客指出,Deci-Nano在价格上极具优势,仅需每百万输入tokens $0.10,而OpenAI的GPT-3.5 Turbo和Claude 3 Haiku价格分别为$0.50和$0.25。

Deci的联合创始人兼首席执行官Yonatan Geifman表示:“Deci-Nano体现了我们面向生产的理念,关注质量和成本效益。”该模型具备8K的上下文窗口,采用Deci的AutoNAC技术开发,旨在通过生成小型模型优化模型效率,接近大型模型的功能。

从财务分析到内容创建,Deci-Nano旨在帮助企业在控制成本的同时推动创新。Deci还提供灵活的部署选项,支持无服务器实例以实现可扩展性,或专用实例以提升隐私和定制性,使企业能够根据不断变化的需求调整其人工智能解决方案,而不牺牲性能。

发布全面的平台

尽管最近的新闻主要集中在Deci-Nano上,但全面生成性人工智能平台的推出代表了一个重要的进展。该平台被描述为“综合解决方案”,针对企业的效率和隐私需求进行了定制。

该平台包括哪些内容?根据Deci的介绍,用户可以访问可微调的LLM、推理引擎和AI推理集群管理解决方案。Deci-Nano是该平台上的第一个专有模型,未来还将推出更多模型,包括一些开源和闭源模型。

推理引擎允许用户根据需要部署Deci-Nano,无论是通过Deci的API、虚拟私有云,还是本地服务器。对于自主管理虚拟私有云的客户,Deci将提供一个容器化模型,以及在其Kubernetes集群中的管理推理服务。

此外,生成性人工智能平台还为希望保持数据在内部的企业提供本地部署选项。客户将获得一个虚拟容器,内含Deci-Nano和Deci的Infery软件开发工具包,以便集成到他们的应用程序中。

关于Deci生成性人工智能平台及其各类产品的定价细节尚未公布,相关更新将根据信息的可用性及时提供。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles