OpenAIが最新の画像生成技術「DALL-E 3」を正式に発表しました。この新バージョンは、ChatGPTとシームレスに統合されており、ユーザーはチャットボット内で直接画像を生成できます。自然な言語でプロンプトを入力することで、会話を中断せずに画像をリクエスト可能です。また、初めの画像が期待通りでない場合でも、ユーザーはChatGPTと会話しながら調整を指示することができ、希望する画像が得られるまで連続的に修正できます。
完璧なプロンプトの作成は難しいかもしれませんが、DALL-E 3はそのプロセスを簡素化することを目指しています。DALL-E 3は現在、月額20ドルのChatGPT Plusサブスクリプションを持つユーザーおよび10月からChatGPT Enterpriseユーザー向けに提供されており、現在は研究プレビュー段階です。今秋にはOpenAI APIを通じてリリースされ、より多くの人々がその機能にアクセスできるようになります。
DALL-E 2に対する大きな進化として、DALL-E 3はユーザーが提供したテキストにより一層マッチした画像を生成する能力が向上しています。OpenAIは、この最新モデルがより高いニュアンスや詳細を理解し、高品質な出力を実現すると強調しています。特筆すべきは、ユーザーが生成した画像の所有権を保持でき、再印刷や販売、商品化が自由にできる点です。
ユーザーの安全性を高めるため、OpenAIは新しいプロトコルを導入しました。DALL-E 2が特定のアーティストのスタイルでの画像リクエストを受け付けていたのに対し、DALL-E 3は現在、生きているアーティストのスタイルを模倣する作品の生成を控えており、知的財産権を保護しています。これは、類似プラットフォームに対する法的措置に続く重要な決定です。
さらに、DALL-E 3は公人の名前を参照するプロンプトを拒否します。これは、プロパガンダや誤情報キャンペーンでの悪用を防ぐための取り組みです。7月の調査では、DALL-E 2が「盗まれた選挙」に関する誤情報に関連するプロンプトを受け入れたことが明らかになっています。
OpenAIは、AI生成画像を特定する新しい方法も探っています。その一環として、DALL-E 3が生成した画像を識別するプロヴナンス分類ツールを開発中です。このツールに関する具体的な情報は限られていますが、今後のOpenAIからの更新が期待されています。
さらに、クリエイターは、自身の画像が将来のOpenAIモデルのトレーニングに使用されるのを防ぐオプションを持つようになりました。このオプションを行使するには、簡単なオンラインフォームに記入するだけで、クリエイティブな出力に対するコントロールが強化されます。
総じて、DALL-E 3は、ユーザーのフィードバックを重視し、安全機能を強化し、アーティストやクリエイターの権利を保護する画像生成技術の驚異的な進化を象徴しています。この革新的モデルは、デジタルアート生成の風景を再定義することが期待されています。