GoogleのImagen 2で驚くべき4秒アニメーションを作成しよう

Googleは、Imagen 2を含む画像生成モデルの重要なアップデートを発表しました。この新機能は、テキストからアニメーションを生成する「テキストからライブ」機能を提供し、ユーザーがテキストプロンプトをもとにアニメーション画像に変換できるようになりました。また、画像編集機能(インペイント、アウトペイント、デジタル透かしなど)も一般利用が可能となりました。

この情報は、Google Cloud Nextカンファレンスで発表されました。Imagen 2のテキストからライブ機能では、最初に24フレーム毎秒でアニメーションGIFが生成され、解像度は360x640ピクセル、持続時間は4秒です。Googleはこの機能の継続的な改善を計画しています。

プレスブリーフィングで、Google CloudのCEO、トーマス・クリアン氏は、「車の静止画ではなく、動いている車の短いアニメーションを見ることができます。特にメディアや広告業界では、この技術を活用してユーザーエンゲージメントを向上させています」と述べました。

Imagen 2は、様々なカメラアングルと動きを持つ画像を生成し、アニメーション全体での一貫性を保つように設計されています。また、安全フィルターやデジタル透かしを取り入れ、生成AIに関連する重要な懸念事項に対処しています。

新たに公開された画像編集機能では、ユーザーは写真から要素を追加したり削除したりでき、Adobe Photoshopの生成フィルツールやコンテンツ認識ツールに似た操作が可能です。また、画像の境界を拡張して、より広い視界を得ることもできます。

これらのアップデートは、Googleの完全管理型Cloud AIプラットフォームであるVertex AIに関する発表の一環です。2023年に発表されたImagen 2は、Google DeepMindの成果物であり、自然言語プロンプトからフォトリアリスティックで高解像度の画像を生成することを目的としています。OpenAIのDALL-E、Midjourney、Adobe Fireflyなどの他の主力モデルと競合し、特に企業がブランドガイドラインやガバナンス基準に沿った画像を生成する助けとなることを目指しています。

Most people like

Find AI tools in YBX