Stability AIは、本日、テキストから画像への変換を大幅に拡張し、3Dコンテンツ制作の領域にも進出する、Stable Diffusionプラットフォームに関するエキサイティングな新機能を発表しました。
このアップデートの目玉は、Stable 3Dモデルの導入です。以前は2D画像生成に特化していたStable Diffusionは、グラフィックデザインやゲーム開発など、多様な3Dコンテンツ制作アプリケーションをサポートするようになりました。
さらに、Stability AIは、2D画像の空をシームレスに置き換えるSky Replacerツールを発表しました。また、Stable Diffusionプラットフォームには、特定の事例での画像微調整を加速するためのStable Fine-Tuningも導入されました。これにより、Stability AIのAPIを用いて生成された画像には、目に見えないウォーターマークが含まれ、創造的なワークフローの整合性が向上します。この取り組みは、生成AIがさまざまな業界でますます重要視される中、信頼性を高めることを目的としています。
Stability AIのCEO、エマド・モスタク氏は、「クリエイティブなストーリーテラーに、視覚に対するコントロールを強化するためのツールを提供することが重要です」と語りました。
競争の激しい生成AI市場の中で
Stability AIの進展は、テキストから画像生成の分野での競争が激化する中でのものです。AdobeのFireflyツールやOpenAIの最近発表されたDALL-E 3モデルは、市場における重要な進化を示しています。Midjourneyも、デザイナーの画像生成を支援するための機能を強化しています。
モスタク氏はこの競争環境を認識し、モデルの提供にとどまらず、包括的なクリエイティブパイプラインを実現することでStability AIを差別化することを目指しています。新しいSky ReplacerとFine-Tuning機能は、基本的な画像生成機能を超えた重要な進展を体現しています。
Sky Replacer:実用的なビジネスツール
画像の背景を置き換えることは新しい概念ではありませんが、Stability AIはこのプロセスを自動化し、ビジネスユーザーの効率を向上させています。モスタク氏は、Sky Replacerツールが不動産業界など、特定の用途に役立つことを強調しました。ユーザーは多様な背景や照明効果を求めており、Stability AIは、それに応じた最適化されたワークフローを提供することに取り組んでいます。「Sky Replacerは、業界特有のニーズに応えるためのツールの始まりであり、過去6〜12ヶ月の経験を反映しています」と述べています。
Stable 3D:クリエイターの新しい可能性
新しいStable 3Dモデルは、Stable Diffusionで使用される拡散モデルを強化し、追加の3Dデータセットやベクトル化技術を取り入れています。モスタク氏は、Stable Diffusionと世界最大の3Dデータベースの一つであるObjaverse-XLデータセットを基に、没入感のある3D世界を創り出す可能性に興奮しています。
従来の3D画像生成方法はリソースを多く消費しますが、モスタク氏はStable 3Dがこのプロセスを効率化し、より迅速に実現可能にすると信じています。最初は非公開プレビューとして利用可能ですが、Stable 3Dは時間とともに進化・改善が期待されています。「このアプローチは、従来の3Dモデル作成と比較して非常に効率的です。かつては相当な時間を要した制作が、今では迅速に行えるようになりました」と語っています。
コンテンツの真正性を担保するウォーターマーク
バイデン政権の最近のAIに関する大統領令に基づき、生成されたコンテンツにウォーターマークを組み込むことが求められています。Stability AIは、目に見えないウォーターマークとコンテンツクレデンシャルをAPIに実装します。この取り組みは、Adobeなどが主導する業界全体の努力の一環であり、生成されたコンテンツの著作権を明確にすることを目指しています。モスタク氏は、「私たちは生成コンテンツの真正性を確保するためのイニシアティブを先導しており、ウォーターマークの統合はその目標に向けた一歩です」と強調しました。この開発は、将来的な帰属やコンテンツ検証を強化するためのメカニズムをサポートすることにも寄与します。