Nvidiaは、革新的な生成AIモデル「Latte3D」を発表しました。このモデルは、テキストプロンプトから瞬時に高品質な3D形状を生成する能力を持っています。トロントのNvidia AIラボで開発されたLatte3Dは、人工知能の分野での重要な進歩を示しており、単純なテキスト入力からほぼリアルタイムで3Dオブジェクトや生物を作成することを可能にします。
NvidiaのAIリサーチ担当副社長サンジャ・フィドラー氏は、Latte3Dを「さまざまな産業におけるクリエイターにとっての変革ツール」として紹介しています。彼女は、「私たちは今、結果を数倍速く生み出せるようになり、ほぼリアルタイムのテキストから3D生成がすべての人にアクセス可能になりました」と述べています。
Latte3Dは、テキストプロンプトを複雑な3Dモデルに変換する仮想3Dプリンターのような働きをします。Nvidia RTX A6000などの1つのグラフィックスプロセッシングユニット(GPU)を使用するだけで、詳細な形状を即座に生成し、従来の3Dデザインで一般的な長時間のレンダリングプロセスを回避します。
クリエイターはLatte3Dを活用することで、煩雑なオブジェクトデザインや3Dアセットライブラリの広範な検索を行うことなく、アイデアを迅速に具現化できます。このモデルは、各テキストプロンプトに基づいて複数のデザインオプションを提供し、ユーザーがニーズに最も適した形状を選択できるよう設計されています。
ただし、専門家は、コンセプトの生成は容易でも、その生成された画像を特定の期待に応じて洗練させることは難しいと警告しています。初期の創造と最終的なカスタマイズとの間には、依然として複雑な障害が存在します。
Latte3Dの多様性は、動物や日常のオブジェクトを含むトレーニングデータセットに表れています。開発者は異なるデータタイプを用いることで、ランドスケープデザインやロボティクスなどの分野への応用を広げることができます。例えば、ランドスケープデザイナーはリアルな植物で庭のレンダリングを効率的に満たすことができ、ロボティクス開発者はLatte3Dを利用して、パーソナルアシスタントロボットのトレーニング用に家庭環境をシミュレーションすることができます。
NvidiaのA100 Tensor Core GPUを活用し、ChatGPTによって生成された多様なテキストプロンプトで訓練されたLatte3Dは、AI駆動のコンテンツ生成の進展に対するNvidiaの取り組みを示しています。多様なテキスト記述に正確に応答できる能力により、ユーザーに応じた形状生成を実現します。
Nvidia ResearchのAIとコンピュータグラフィックスのイノベーションを目指すミッションの一環として、Latte3Dは技術の限界を押し広げるNvidiaの献身を体現しています。数百人の科学者とエンジニアから成るグローバルチームを持つNvidiaは、AI、コンピュータビジョン、自動運転技術、ロボティクスの分野での進歩をリードし続けています。