通过Stability AI API轻松实现Stable Video传播,提升视频创作体验

Stability AI因其知名的Stable Diffusion文本转图像生成器而受到广泛认可,现已推出其最新基础模型——Stable Video Diffusion(简称SVD)。该模型现已通过公司的开发者平台和应用程序接口(API)向第三方开发者开放,支持他们将其集成至应用程序、网站和软件解决方案中。

“这一新增功能为各行业提供了程序化访问最新的视频模型,我们的目标是帮助开发者高效地将先进的视频生成技术无缝嵌入其产品中,”公司在一篇博客中表示。

尽管这一发布为希望创建AI生成视频的企业提供了强大的工具,但也引发了争议。Stability AI最近因使用包含不当内容的LAION-5B数据集而受到批评,该数据集已被移除流通。

尽管面临这些挑战,Stability的SVD API在视频质量方面仍具竞争优势。根据公司在LinkedIn上的一篇帖子,SVD模型能够在仅41秒内生成2秒的视频,包含25帧生成图像和24帧的影片插值。虽然这对于大规模视频广告活动可能不够,但在制作GIF和特定信息(包括梗图)时非常有用。

SVD与Runway和Pika Labs等其他视频生成模型竞争,后者最近获得了5500万美元的融资并推出了新的视频编辑平台。然而,与Stability AI不同,这些选择不通过API提供,用户需要直接在其网站或应用上访问。

此外,Stability AI计划推出用户友好的网页体验,鼓励用户加入等待名单以获得早期访问权限。

深入了解Stable Video 扩散

Stable Video 扩散在一个月前的研究预览中推出,允许用户将JPG和PNG等静态图像转换为MP4视频。初步样本显示,尽管该模型能够生成时长最多为两秒的短视频,但仍处于开发阶段,生成时长低于某些研究导向的模型。

然而,多个短片段可以组合生成更长的视频。Stability AI声称该模型在广告、市场营销、影视和游戏等多个领域具有潜在应用价值。

值得注意的是,最新模型能够生成多种布局和分辨率的视频,包括1024×576、768×768和576×1024。它还具备运动强度控制和基于种子的生成能力,支持可重复和随机输出。

应对争议

Stable Video Diffusion的推出为企业整合视频功能提供了便捷途径,然而它也突显出Stability AI在培训数据来源引发持续争议中的市场立足点。

最近,斯坦福互联网观测站报告指出,训练流行AI模型的LAION-5B数据集含有不当内容,促使该数据集被移除。此外,公司还面对对其未经许可获取版权图像以创建Stable Diffusion的集体诉讼。

当前,Stability AI的开发者平台API为用户提供所有模型的访问,包括Stable DiffusionXL文本转图像生成器和新推出的SVD模型。公司还为客户提供本地托管这些模型的会员选项。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles