Nvidia는 텍스트 프롬프트에서 즉시 고품질 3D 형상을 생성할 수 있는 혁신적인 생성형 AI 모델인 Latte3D를 출시했습니다. 토론토에 있는 Nvidia AI 연구소에서 개발된 Latte3D는 인공 지능의 중요한 진전을 나타내며, 간단한 텍스트 입력으로 3D 객체와 생물을 거의 실시간으로 생성할 수 있게 합니다.
Nvidia의 AI 연구 부사장인 Sanja Fidler는 Latte3D를 다양한 산업의 창작자들에게 혁신적인 도구로 소개했습니다. “이제 우리는 결과를 훨씬 더 빠르게 생산할 수 있어, 거의 실시간에 가까운 텍스트-투-3D 생성이 모두에게 가능해졌습니다,”라고 그녀는 말했습니다.
Latte3D는 핵심적으로 가상의 3D 프린터처럼 작동하여 텍스트 프롬프트를 복잡한 3D 모델로 변환합니다. Nvidia RTX A6000과 같은 단일 그래픽 처리 장치(GPU)를 사용하여, 모델은 자세한 형상을 즉각적으로 생성하며 전통적인 3D 디자인에서 흔히 발생하는 긴 렌더링 과정을 건너뜁니다.
창작자들은 Latte3D로 아이디어를 신속하게 실현할 수 있으며, 번거로운 객체 디자인이나 3D 자산 라이브러리 검색의 필요를 없앨 수 있습니다. 이 모델은 각 텍스트 프롬프트에 기반하여 여러 디자인 옵션을 제공하여, 사용자가 자신의 필요에 가장 적합한 형상을 선택할 수 있게 합니다.
하지만 전문가들은 아이디어 생성은 쉽지만, 이러한 생성 이미지를 특정 기대에 맞게 다듬는 것은 도전적일 수 있다고 경고합니다. 초기 창작과 최종 맞춤화 사이에는 여전히 복잡한 간격이 존재합니다.
Latte3D의 다재다능함은 동물과 일상 물체를 포함하는 훈련 데이터셋에서 명확하게 드러납니다. 개발자는 다양한 데이터 유형으로 모델을 조정하여 조경 디자인 및 로봇 공학과 같은 분야로 응용 범위를 확장할 수 있습니다.
예를 들어, 조경 디자이너는 실제 식물로 정원 렌더링을 효율적으로 채울 수 있으며, 로봇 개발자는 Latte3D를 사용해 개인 비서 로봇 훈련을 위한 가상 주거 환경을 시뮬레이션할 수 있습니다.
Nvidia A100 Tensor Core GPU로 구동되고 ChatGPT에서 생성된 다양한 텍스트 프롬프트로 교육된 Latte3D는 AI 기반 콘텐츠 생성의 진보를 위해 Nvidia가 헌신하고 있음을 보여줍니다. 텍스트 설명에 정확하게 대응할 수 있는 능력 덕분에 사용자는 맞춤형 형상 생성을 보장받습니다.
Nvidia Research의 AI 및 컴퓨터 그래픽스 혁신 미션의 일환으로, Latte3D는 기술 경계를 확장하는 회사의 헌신을 잘 보여줍니다. 수백 명의 과학자와 엔지니어로 구성된 글로벌 팀을 통해, Nvidia는 AI, 컴퓨터 비전, 자율 주행 기술 및 로봇 공학 분야에서 지속적으로 선두를 지키고 있습니다.