Meta・プラットフォームズがAI画像生成に進出
Meta・プラットフォームズは、Facebook、Instagram、WhatsAppの親会社であり、オープンソースの大型言語モデル「Llama 2」を開発した企業です。この度、テキストから画像を生成するAI技術の分野でのプレゼンスを強化しています。
Metaは今年初めに、FacebookとInstagramのメッセンジャー内でテキストから画像及びテキストからステッカーを生成する機能を発表しましたが、今週は「Imagine」というスタンドアロンのテキストから画像生成AIを新たに導入しました。これはメッセージングプラットフォームの外部からアクセス可能です。画像生成を始めるには、imagine.meta.comにアクセスし、Meta、Facebook、またはInstagramのアカウントでログインする必要があります。私がFacebookでログインを試みた際には、新しい「Metaアカウント」の作成が必要でしたが、手続きは簡単でした。
初期の反応はさまざま
現在、AIアーティストたちはMeta Imagineを使用して、高品質な画像を迅速に生成しています。一部のユーザーは、Midjourney、Stable Diffusion、OpenAIのDALL-E 3などの他の人気AI画像生成ツールと比較しています。ただし、初期の評価では、Imagineが時折リアルな人物や構築物を生成する一方で、しばしば歪んだ身体や風景が生じるという問題が指摘されています。
Imagineのインターフェースはシンプルで、簡単なプロンプト入力欄と4つの生成された画像がダウンロード可能です。メッセンジャーアプリとは異なり、現時点では画像のリミックス機能はありません。また、画像のサイズ変更は1:1のアスペクト比のみに制限され、異なる比率を入力しようとすると、結果は変わらないことがわかりました。
生成された各画像の右下には「Imagine」とロゴが入ったウォーターマークが付いています。Metaの広報担当者は、AI生成画像の透明性とトレーサビリティを向上させるために、目に見えないウォーターマークも近日中に追加する予定であると述べました。これらの制約にもかかわらず、Metaは多くのサブスクリプションを必要とする既存のAIアート生成ツールに対抗する無料の機能を提供することを目指しています。
広範なトレーニングデータでパワーアップ
Imagineは、MetaのAIモデル「Emu」を基に動作しており、FacebookやInstagramから収集された11億枚のユーザー生成画像でトレーニングされています。Metaは、プライベートメッセージや非公開の画像はトレーニングデータに含まれていないと確認しています。競合するAIアート生成ツールが著作権侵害の疑いで厳しい目を向けられる中、Metaのユーザーデータを活用する戦略は、賢明で倫理的であるように見えますが、これらの画像を投稿したユーザーの同意に関する疑問も引き起こします。
Metaの研究者たちは、Emuの品質調整が高品質な画像と対応するテキストの比較的小さなデータセットで達成されたことを強調しており、これにより生成される画像の美しさが向上した一方で、モデルの柔軟性を損なうことはありませんでした。
興味深いことに、MetaがオープンソースAIを支持しているにもかかわらず、EmuやImagineサービスは現在オープンソースではありません。この件についての明確な情報を求めてMetaに連絡を取っており、更新があればお知らせします。
Imagineの導入は、Metaのプラットフォーム全体での新たなAI機能を紹介する一環であり、ユーザーがFacebook MessengerやInstagramメッセージ内でテキストプロンプトに基づいて新しい画像を作成できる「再イメージ」機能も含まれています。