Nvidia 推出了 Latte3D,一款革命性的生成式 AI 模型,能夠即時從文本提示生成高品質的 3D 形狀。該模型由 Nvidia 位於多倫多的 AI 實驗室開發,標誌著人工智慧的一次重大突破,使得從簡單文本輸入創建 3D 物體和生物成為近乎實時的可能性。
Nvidia AI 研究的副總裁 Sanja Fidler 指出,Latte3D 是各行各業創作者的變革工具。她表示:“我們現在可以以快幾個數量級的速度產出結果,讓近乎實時的文本轉 3D 生成變得對所有人可及。”
Latte3D 的核心功能類似於虛擬的 3D 印表機,將文本提示轉換為精緻的 3D 模型。使用單一的圖形處理單元(GPU),例如 Nvidia RTX A6000,該模型能即時生成詳細的形狀,省略了傳統 3D 設計中冗長的渲染過程。
創作者們可以迅速將想法實現,無需繁瑣的物件設計或大量搜尋 3D 資產庫。該模型根據每個文本提示提供多種設計選擇,使用者可以選擇最適合自己需求的形狀。
不過,專家提醒,雖然生成概念很簡單,將這些生成的圖像細化以滿足具體需求仍具挑戰性。初步創作與最終自訂之間的差距,仍是一個複雜的難題。
Latte3D 的多功能性在其訓練數據集中得以體現,這些數據包括動物和日常物品。開發者還可以藉由不同數據類型調整模型,擴大其在景觀設計和機器人技術等領域的應用。
例如,景觀設計師可以有效地在花園效果圖中填充真實植物,而機器人開發者則可能利用 Latte3D 模擬家庭環境,以訓練個人助理機器人。
Latte3D 由 Nvidia A100 Tensor Core GPU 提供動力,並在 ChatGPT 生成的多樣文本提示上進行訓練,展示了 Nvidia 在推進 AI 驅動內容創作方面的承諾。它能夠準確響應各種文本描述,確保用戶獲得量身定制的形狀生成。
作為 Nvidia Research 在 AI 和計算機圖形學創新的使命的一部分,Latte3D 充分體現了該公司推動技術邊界的決心。擁有數百名科學家和工程師的全球團隊,Nvidia 持續引領 AI、計算機視覺、自駕技術和機器人的進步。