GoogleがImagen 3を発表：テキストから画像を生成する究極のモデル、プライベートプレビュー版登場

Home AIニュース GoogleがImagen 3を発表：テキストから画像を生成する究極のモデル、プライベートプレビュー版登場

Googleは、テキストから画像を生成するモデル「Imagen 3」の大規模なアップデートを発表しました。この新モデルは、詳細な描写の向上、自然言語理解の改善、優れたテキストのレンダリングを約束します。Imagen 3は、現在、特定のクリエイター向けにImageFXでプライベートプレビュー中で、開発者はアクセスを得るための待機リストに登録できます。さらに、Imagen 3はVertex AIに統合される予定です。

「これは私たちの最も進化した画像生成モデルです」と、Google DeepMindのシニアリサーチディレクター、ダグラス・エック氏がI/O開発者カンファレンスで述べました。「Imagen 3は、フォトリアリズムや豊かなディテールを提供し、視覚的アーチファクトや歪みを大幅に減少させます。プロンプトを会話的に理解し、創造性や詳細を多く提供するほど、より良い出力が得られます。Imagen 3は長文のプロンプトにおける微妙な要素の取り入れが得意で、画像生成モデルが直面してきたテキストレンダリングの課題に対して、これまでの最高の成果を示しています。」

この発表は、Googleが前回の生成モデルImagen 2をVertex AIで広く公開したわずか6か月後に行われました。この時期には、4月にテキストからライブ機能の導入もあり、AI画像生成ツールの競争が激化する中で、Googleは競争力を維持する必要があります。他のツールには、OpenAIのDALL-E、Midjourney、AdobeのFirefly、MetaのAI、MicrosoftのDesignerなどがあります。

ただし、Googleのこの分野での道のりには課題もありました。今年初め、AI生成の画像に対して一部の批評家から「過剰に政治的」とされる批判を受けました。これには、アメリカの建国の父たちを黒人男性と共に描写したり、第二次世界大戦のドイツ兵と黒人男性およびアジア系女性を一緒に描写したりしたことが含まれます。Googleはこの誤りを認め、CEOのサンダー・ピチャイはBloombergとのインタビューで謝罪を再確認しました。

Imagen 3の発表は、Google I/Oでのいくつかのエキサイティングなアップデートの一環であり、新しい動画生成モデル「Veo」の発表も含まれています。

Google、Veoを発表：OpenAIのSoraに挑む驚異の新しい生成AI動画モデル

OpenAIの新しいGPT-4oモデルの理解：開発者に与える影響と機会

Most people like

Letterdrop

64.5K

Letterdropは、ユーザーの検索意図を効果的に解釈し応答することで、ウェブサイトのトラフィックを向上させるために設計された高度なAI駆動のSEOツールです。

SEOコンテンツ最適化 AI Content Generator

One AI

188.3K

優れた生成AIソリューションを提供する先進的なAIプラットフォームを発見してください。シームレスな製品統合を実現し、事前学習済みモデルとニーズに合わせたカスタマイズオプションを備えています。

生成AI Large Language Models (LLMs)

Alphazria

52.8K

成熟した観客向けに特別にデザインされたAI生成のアダルトコンテンツの世界を探求しましょう。大人の好みに合わせた革新的で魅力的な体験に浸ってみてください。

AI生成画像 NSFW

NsfwGPT.AI

256.8K

今日の急速に進化するデジタル環境では、人工知能（AI）と没入型体験の交差点が増大する観衆を魅了しています。技術が進歩する中、AIコミュニティは革新的なツールを活用して、私たちの環境とのインタラクションを変革し、エンターテインメントと学習の両方を向上させています。このダイナミックな融合を探求することで、AIの可能性が際立つだけでなく、ユーザーに共鳴する魅力的で没入型の体験を創出する上での役割も明らかになります。私たちと共に、AIがどのように私たちの世界の理解と関わりを革命的に変えているのかを探っていきましょう。

AIテクノロジー NSFW

Find AI tools in YBX