Stability AI는 텍스트 및 비디오 콘텐츠 생성을 위한 Stable Artisan Discord 봇을 소개하며 생성 AI 기능을 확장합니다.
출시 개요
오늘 공식 출시된 이 서비스는 사용자들이 Discord를 통해 Stable Diffusion 3 (SD3)로 이미지를 생성하고, Stable Video Diffusion (SVD)로 비디오를 제작할 수 있게 해줍니다. 이 개념은 브랜드 경쟁자인 Midjourney의 성공적인 모델을 따른 것입니다.
배경 및 접근
이전에는 Stability AI가 API를 통해 기본 Stable Diffusion 모델에 접근할 수 있도록 했으며, 모델 가중치는 HuggingFace에서 이용 가능합니다. 2023년 2월까지 Stable Diffusion은 Clipdrop을 통해 제공되었으나, Clipdrop은 현재 AI 스타트업 Jasper의 일부입니다. Stable Video는 Stability AI 소속의 StableVideo.com에서 여전히 이용 가능합니다.
Stability AI의 공동 CEO 겸 CTO인 Christian Laforte는 “Stable Artisan의 초기 런칭을 통해 사용자 참여를 모니터링하고 Discord 봇의 기능이 우리의 품질 기준에 부합하는지 확인할 수 있을 것입니다. 이후 추가 기능을 도입할 계획입니다.”라고 밝혔습니다.
가격 구조
Stable Artisan은 유료 서비스로 3일 무료 체험이 가능합니다. 기본 옵션은 월 900 크레딧을 제공하는 $9부터 시작하며, 프리미엄 플랜은 월 1,200 크레딧을 포함하여 $99입니다. Stability AI는 이미지 생성 비용에 대한 크레딧 시스템을 사용합니다: SD3 이미지 생성에는 6.5 크레딧, 구형 Stable Diffusion 모델에는 3 크레딧, 비디오 생성에는 20 크레딧이 필요합니다. 사용자는 Stability AI 웹사이트에 계정을 생성하고 Discord 서버에 가입하면 서비스를 시작할 수 있습니다. 주의할 점은 현재 Stable Artisan 서비스가 새로 발표된 Stability AI 멤버십과는 별개라는 것입니다.
Stable Artisan의 기능
Stable Artisan은 기본 이미지 생성 이상의 기능을 제공하며, 이전의 Clipdrop 서비스에서 제공했던 편집 및 사용자 맞춤화 기능을 포함하고 있습니다. 주요 기능은 다음과 같습니다:
- 검색 및 교체: 간단한 언어 프롬프트를 사용해 이미지 내 객체를 식별하고 교체하며, 마스크 없이 자동으로 타겟 객체를 분리합니다.
- 배경 제거: 전경 요소를 보존하면서 배경을 손쉽게 제거합니다.
- 창의적 업스케일: 저해상도 이미지를 최대 4K 품질로 향상시킵니다.
- 아웃페인팅: 이미지에 새 요소를 추가하여 원활하게 확장합니다.
- 컨트롤 스케치: 거친 스케치를 고품질 이미지로 정밀하게 변환합니다.
- 컨트롤 구조: 입력 이미지의 구조를 유지하며 이미지를 생성합니다.
미래 전망: Stable Assistant
Stable Artisan은 Stability AI의 이미지 생성 도구에 쉽게 접근할 수 있는 방법을 제공하지만, 더 많은 발전이 진행 중입니다. 현재 Stable Audio는 API를 통해 상용화되었으나, Stable Artisan에서는 통합되지 않았습니다. Stable Code 및 Stable LM과 같은 코드 및 텍스트 생성 모델은 아직 Stable Artisan을 통해 이용할 수 없습니다. Stability AI는 또한 Stable Assistant라는 더 포괄적인 대화형 챗봇을 개발 중이며, 현재 SD3와 함께 베타 테스트 중입니다. 이 웹 기반 챗봇은 Stability AI의 텍스트-이미지 및 대형 언어 모델(LLM) 기술을 활용하여 자연어 대화를 통해 사용자를 지원합니다.
Laforte는 “두 애플리케이션은 서로 다른 사용자 그룹을 대상으로 하며, 모두 Stability AI에서 적극적으로 개발되고 있습니다.”라고 언급했습니다.