AI生成画像の進化を私たちは長い間見てきましたが、最近、業界の先駆者たちが顕著な進展を遂げています。今週は、Midjourney、Googleの最新モデル、Grokからの注目すべき更新が報じられました。
これらの企業は、それぞれ異なる速度と方向でAI技術の限界を押し広げています。競争が激化する中で、どれだけの進展があったのかを観察するのは興味深いことです。
Midjourneyが新しいウェブエディターを発表
Midjourneyは最近、新しいウェブエディターを導入しました。これにより、画像編集ツールを一つの使いやすいインターフェースに統合しました。従来は、再構成、既存画像の修正、パン、キャンバスの拡張、ズームといった機能のために複数のメニューを操作する必要がありましたが、新しいUIはこのプロセスを大幅に簡素化し、元々Discord上での操作からの転換を示しています。
MidjourneyのCEO、デイビッド・ホルツ氏によると、AI生成画像の編集を「よりシームレスにすること」が目標です。Discordからウェブベースのアプリケーションへの移行が進む中、Midjourneyでは「daily-theme」「prompt-craft」「general-1」といった人気のチャンネル間での活動も同期されます。また、新しいデジタルブラシ選択ツールが従来の選択ツールにとって代わり、プラットフォーム上で10枚以上の画像を作成したユーザーにとって編集作業がスムーズになります。クリエイターコミュニティからの初期フィードバックは非常に好評です。この更新は、画像品質、手のディテールにおける正確性、処理速度を向上させたMidjourney 6.1のリリースに続くものです。
Grok-2の物議を醸す発表
Midjourneyのアップデートからわずか2日後、Elon MuskのxAIスタートアップによってGrok-2が発表されました。これはAI画像生成におけるもう一つの重要な進展です。Black Forrest LabのFlux.1モデルによって支えられたGrok-2は、その印象的な画像品質とアクセスのしやすさから注目を集めています。
しかし、Grok-2のガイドラインは懸念を呼び起こしています。他のAI生成ツールとは異なり、知的財産、暴力、明示的なコンテンツに関するポリシーがほとんどないようです。この明確な境界線の欠如は論争を巻き起こし、ユーザーはAI生成視覚の初期のような不安定で奇抜な画像を作成しています。マスク氏はGrok-2を「世界で最も楽しいAI」と表現し、この寛容さが故意の選択かもしれないことを示唆しています。将来的なAI技術の方向性に影響を与える可能性があります。
GoogleがImagen 3を発表
最後に、Googleはその最新のAIモデルImagen 3を発表しました。これは「最高品質のテキストから画像へのモデル」としています。アメリカのユーザー向けにリリースされたImagen 3は、詳細、照明、そして過去のモデルに比べて不要なアーティファクトが少なくなることを約束しています。このモデルは特にテキストの生成に優れており、迅速なスケッチから高解像度画像まで、様々なニーズに応じたバージョンがあります。現在、Imagen 3はGoogleのAI Test Kitchenを通じてImageFXの一部として利用可能ですが、まだクローズドベータ版であり、参加には待機リストに登録する必要があります。