Stability AI公司通过推出 Stable Artisan Discord 机器人,扩展其生成式人工智能的能力,以实现文字和视频内容的创作。
启动概述
该服务今天正式上线,用户可以通过 Discord 使用 Stable Diffusion 3(SD3)生成图像,并通过 Stable Video Diffusion(SVD)创建视频。这一概念借鉴了竞争对手 Midjourney 自 2022 年以来建立的成功模式。
背景与访问
此前,Stability AI公司通过 API 提供核心的 Stable Diffusion 模型访问,并在 HuggingFace 上提供模型权重。到 2023 年 2 月,Stable Diffusion 也可以通过 Clipdrop 访问,该平台现在已成为人工智能初创公司 Jasper 的一部分。Stable Video 仍可通过 Stability AI 拥有的 StableVideo.com 网站访问。
Stability AI公司联合首席执行官兼首席技术官 Christian Laforte 表示:“Stable Artisan 的初始推出将使我们能够监控用户互动,并确保 Discord 机器人的功能符合我们的质量标准,然后再添加更多功能。”
定价结构
Stable Artisan 是一项收费服务,提供 3 天的免费试用。标准计划起价为 9 美元,包含每月 900 个积分,优质计划为 99 美元,提供每月 1200 个积分。Stability AI采用积分系统来计算图像生成费用:生成 SD3 图像需 6.5 个积分,旧版 Stable Diffusion 模型需 3 个积分,视频生成则需 20 个积分。
用户可以在Stability AI的官方网站上创建账户并加入其 Discord 服务器。值得注意的是,Stable Artisan 服务目前与新发布的Stability AI会员(Stability AI Membership)分开。
Stable Artisan 的功能
Stable Artisan 超越了基本的图像生成,提供多种编辑和自定义选项,类似于之前的 Clipdrop 服务。关键功能包括:
- 搜索与替换:使用简单的语言提示识别并替换图像中的物体,无需使用遮罩即可自动分割目标物体。
- 去除背景:轻松消除背景,同时保留前景元素。
- 创意放大:将低分辨率图像增强至最高可达 4K 的质量。
- 扩展绘制:通过添加新元素无缝扩展图像。
- 控制草图:将粗略草图转化为高质量图像。
- 控制结构:在生成图像时保持输入图像的框架。
未来展望:Stable Assistant
虽然 Stable Artisan 为用户提供了访问Stability AI图像生成工具的便捷方式,未来的发展仍在进行中。目前,该服务尚未整合上个月通过 API 和在 StableAudio.com 网站上线的 Stable Audio。其他代码和文本生成模型,如 Stable Code 和 Stable LM,目前也未通过 Stable Artisan 提供。
Stability AI公司还在开发一个名为 Stable Assistant 的更广泛的对话聊天机器人,目前正处于与 SD3 一起测试的 beta 版本。这款基于网络的聊天机器人利用Stability AI的文本到图像和大语言模型(LLM)技术,通过自然语言对话帮助用户。
Laforte 指出:“这两个应用程序面向不同的用户群体,均由Stability AI积极开发。”