OpenAIのDALL-E 3が登場:無料ユーザーは1日2枚の画像を生成可能
2023年8月9日、OpenAIはChatGPTの無料ユーザーがDALL-E 3モデルを使用して画像を生成できるようになったと発表しました。これにより、無料ユーザーは1日あたり少なくとも2枚の画像を作成できます。この決定は多くの議論を呼び起こしましたが、1日の制限があるため反応はやや控えめでした。
DALL-E 3は2022年9月に初めてリリースされ、その当初は有料のChatGPT Plusユーザー限定でした。ユーザーはChatGPTの入力ボックスにプロンプトを入力することで画像を生成しますが、1日の制限を超えると「画像生成の上限に達しました。有料プランにアップグレードするか、明日同じ時間に再試行してください」というメッセージが表示されます。
OpenAIのこの動きは、AIアート市場における激しい競争が背景にあります。DALL-E 3は、MidjourneyやStable Diffusion、Adobe Fireflyといった強力なライバルと競っています。具体的には、Midjourneyは美術的スタイルと細部の描写に優れていますが、プロンプトへの適合性においてDALL-Eには及びません。Stable Diffusionはオープンソースモデルで、超現実的な風景や建築デザインに独自の強みを発揮します。一方、Adobe Fireflyは高品質なポートレート描写で知られ、広いダイナミックレンジを提供しています。
DALL-E 3の大きな改善点の一つは、ChatGPTがユーザーの画像作成を助けるプロンプトを生成できるようになったことです。例えば、OpenAIの主任研究者であるアディティア・ラメシュ氏は、山中のラーメン店のロゴを設計するためにChatGPTを利用し、選択肢をいくつか得ることができました。
OpenAIはDALL-E 3の画像生成機能をウェブ、iOS、Androidの各プラットフォームに展開しています。また、2023年4月には、ユーザーが自分の説明に基づいて生成した画像を調整できる新しい編集インターフェースも導入しました。さらに、DALL-E 3は2月から、AIで生成されたコンテンツを識別するためにCoalition for Content Provenance and Authenticity (C2PA)の透かしを組み込んでいます。
OpenAIの内部人事の変化もこの改革の一因です。頻繁な役員の交代や人材の流出は、計画されていたGPT-5のリリースを10月に延期させ、ユーザーの失望や離脱のリスクを高めています。また、最近のGoogleのGemini 1.5 Proのベータテストでは、ChatGPT-4を上回る性能を発揮し、ChatGPTの将来への懸念を一層強めています。
ユーザーを保持するために、OpenAIは無料ユーザー向けにDALL-E 3を開放し、ユーザー体験を向上させ、市場競争に積極的に対応する姿勢を示しています。