구글, 신규 AI 콘텐츠 생성 모델 발표: Veo와 Imagen 3에 대한 통찰력

올해 Google I/O 컨퍼런스에서 Google은 최신 AI 미디어 생성 엔진인 Veo와 Imagen 3을 발표했습니다. Veo는 고품질 1080p 비디오를 제작할 수 있으며, Imagen 3은 텍스트에서 이미지를 생성하는 새로운 프레임워크를 지니고 있습니다. 이러한 제품들이 산업을 혁신할 것이라는 보장은 없지만, Google은 OpenAI의 Sora 비디오 모델 및 DALL-E 3와 경쟁력을 유지하는 데 도움을 주고 있습니다.

Google은 Veo가 "자연어 및 시각적 의미에 대한 깊은 이해"를 가지고 있어 사용자 설명을 바탕으로 1분 이상의 비디오를 생성할 수 있다고 주장합니다. 또한, 시간 경과 촬영과 같은 영화 제작 및 시각 기술 관련 개념을 이해하고 있어 AI 비디오 생성 모델의 필수 기능으로 자리 잡았습니다.

Veo의 능력을 증명하기 위해 Google은 Donald Glover와 그의 창작 스튜디오 Gilga와 협력하여 텍스트 설명을 기반으로 생성된 컨버터블 도로 여행과 항해 장면이 포함된 홍보 비디오를 제작했습니다. Google에 따르면 Veo는 실제 물리적 현상을 시뮬레이션하고 고화질 비주얼을 렌더링하는 데 있어 이전 모델보다 우수하다고 합니다. Glover는 비디오에서 "모두가 감독이 되어야 한다; 서로의 이야기를 나누면 이해가 더 깊어진다"고 말했습니다.

AI 생성 비디오가 인간 예술성을 재현하는 것에 대한 호기심으로 관객의 사랑을 받을지는 불확실하지만, 이는 Google과 OpenAI가 도구를 홍보하는 데 주저하지 않게 합니다. Veo는 현재 Google의 VideoFX 도구에서 일부 창작자에게 사용 가능하며, YouTube Shorts와 같은 플랫폼에서도 출시될 예정입니다. YouTube Shorts에 통합되면, Google의 TikTok에 대한 경쟁력을 크게 향상시킬 수 있습니다.

Imagen 3에 대해 Google은 텍스트에서 이미지를 생성하는 회사의 "최고 품질" 모델이며 “현실적이고 생동감 넘치는” 이미지를 생성하면서 아트팩트를 최소화한다고 주장합니다. Imagen 3의 진정한 도전은 DALL-E 3와의 비교에서 나타나며, Google은 Imagen 3이 텍스트와 긴 프롬프트 처리를 더 똑똑하게 한다고 밝혔습니다.

이와 더불어 Google은 음악 AI 샌드박스 도구를 시험하기 위해 Wyclef Jean과 Bjorn과 협력하였으며, 이는 곡 및 비트 생성에 도움을 줄 수 있도록 설계되었습니다. 현재까지 보여진 콘텐츠는 짧았지만, 상당히 흥미로운 사례들을 보여주었습니다.

일출부터 인간의 노화에 이르기까지, AI는 점점 더 지능을 갖추고 있습니다. Google의 최신 미디어 생성 도구들은 이런 방향으로 나아가고 있습니다. AI에 수십억 달러를 투자하면서 Google은 차세대 컴퓨팅 기술의 혁신을 선도할 계획입니다. 이러한 기술들이 삶을 향상시키거나 감동적인 예술을 창조할 가능성은 주목할만한 주제입니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles