Stable Diffusion 3 API发布:准备迎接即将推出的Stable助手!

经过短短两个月的预览,Stability AI兴奋地推出其下一代生成式AI模型——Stable Diffusion 3,同时还推出了其创新聊天机器人技术的早期预览版,名为“Stable Assistant”。

Stable Diffusion 3于2月份首次宣布并进行预览,现在已经可以通过Stability AI开发者平台的API访问。该API使得将强大的文本到图像生成能力轻松整合到各种服务和应用中成为可能。此外,还推出了增强性能的Turbo版本——Stable Diffusion 3 Turbo。

Stable Diffusion 3运用了先进的机器学习技术,旨在显著提升图像和排版质量。在API发布过程中,确保模型的生产就绪性是首要任务。“我们实施了多项安全措施以防止SD3的滥用,并根据用户反馈不断完善这些措施,”Stability AI的CTO兼临时共同首席执行官Christian Laforte表示。

开放模型即将推出

虽然Stable Diffusion 3现在可以通过API获得,但尚未发布开放模型,不过这项功能正在开发中。“在开放发布之前,我们将不断改进模型,”Laforte确认道。“与我们开放生成式AI的承诺一致,我们将很快通过Stability AI会员计划提供模型权重,以便自我托管。”

这一会员策略于去年12月首次宣布,旨在为公司建立新的收入模式。

Fireworks合作提升API性能

Stability AI与Fireworks AI的合作将提升Stable Diffusion 3 API的性能。优化生成式AI应用的API推理,尤其是在大规模应用中,可能相当复杂,但Fireworks AI在机器学习编译器方面的专业知识将有助于解决这些挑战。“Fireworks AI是行业领先的ML编译器专家,对于优化我们模型的推理速度至关重要,”Laforte指出。“与他们的合作使我们能够提供市场上最快速、最可靠的企业级API平台。”

Stable Diffusion 3的创新

Stable Diffusion的核心是扩散模型,多个创新增强了其功能。值得注意的是,Multimodal Diffusion Transformer (MMDiT) 架构的引入,提升了对文本的理解和排版准确性。

对于提供更快性能的SD3-Turbo模型,采用了一种名为潜在对抗扩散蒸馏(Latent Adversarial Diffusion Distillation, LADD) 的新方法。“本质上,SD3-Turbo的速度是SD3的十倍,同时生成的图像质量几乎相同,”Laforte解释道。

介绍Stable Assistant

除了新的Stable Diffusion模型,Stability AI还推出了Stable Assistant的早期测试版,这是一款由公司文本和图像生成技术驱动的聊天机器人。与OpenAI的ChatGPT Plus集成DALL-E 3类似,Stable Assistant能够通过对话进行图像生成。

Laforte形容Stable Assistant是一款用户友好的聊天机器人,它结合了Stable Diffusion 3和最近发布的Stable LM 2 12B的能力。这个工具不仅能够根据讨论生成图像,还能提供信息性回应、协助写作项目,并用相关图像增强内容。“Stable Assistant旨在成为我们的多模态聊天机器人,提供对我们所有模型和API服务的访问,而无需技术专业知识,”Laforte表示。“我们计划通过增加图像编辑功能并整合视频、3D、音频和代码等其他模态的模型,不断增强其能力。”

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles