알리바바의 혁신적인 AI 시스템 'EMO'가 당신의 사진으로 현실감 넘치는 말하기 및 노래하는 비디오를 생성합니다.

Home AI 뉴스 알리바바의 혁신적인 AI 시스템 'EMO'가 당신의 사진으로 현실감 넘치는 말하기 및 노래하는 비디오를 생성합니다.

알리바바 지능형 컴퓨팅 연구소의 연구자들이 “EMO” (Emote Portrait Alive)를 공개했습니다. 이 혁신적인 AI 시스템은 단일 초상화 사진을 애니메이션화하여 실제처럼 사람의 말이나 노래하는 모습을 담은 동영상을 생성할 수 있습니다. arXiv에 발표된 연구 논문에 따르면, EMO는 제공된 오디오 트랙의 뉘앙스에 잘 맞는 유동적이고 표현력 있는 얼굴 움직임과 머리 자세를 생성합니다. 이는 오디오 기반의 대화형 비디오 생성에서 중요한 발전을 의미하며, 오랫동안 AI 연구자들에게 도전 과제가 되어왔습니다.

"전통적인 기술은 인간의 다양한 표정과 개별 얼굴 스타일의 독특함을 정확히 포착하는 데 어려움을 겪습니다." 라고 주 저자 린루이 티안은 설명했습니다. "이러한 문제를 해결하기 위해 EMO라는 새로운 프레임워크를 제안합니다. EMO는 3D 모델이나 얼굴 랜드마크 없이 직접 오디오에서 비디오로 변환하는 접근 방식을 사용합니다."

직접 오디오-비디오 변환

EMO 시스템은 현실적인 합성 이미지를 생성하는 데 강력한 AI 기술인 확산 모델을 활용합니다. 연구자들은 EMO를 연설, 영화, TV 쇼 및 음악 공연에서 수집된 250시간 이상의 대화 비디오 데이터셋으로 훈련시켰습니다. 이전의 3D 얼굴 모델이나 혼합 형태에 의존하는 방법과 달리, EMO는 오디오 파형을 직접 비디오 프레임으로 변환합니다. 이는 자연스러운 말하기와 연관된 미세한 움직임과 고유한 특성을 포착할 수 있는 기능을 제공합니다.

우수한 비디오 품질과 표현력

연구 결과에 따르면, EMO는 비디오 품질, 신원 보존 및 표현력에서 기존 최첨단 방법을 크게 능가합니다. 사용자 연구 결과, EMO가 생성한 비디오는 경쟁 시스템보다 더 자연스럽고 감정적이라고 인식되었습니다.

실감 나는 노래 애니메이션

대화 비디오뿐만 아니라 EMO는 노래하는 초상화를 애니메이션화하여 음성 성과에 맞춰 정확한 입 모양과 표현력 있는 얼굴 특징을 생성할 수 있습니다. 이 시스템은 입력 오디오의 길이에 따라 임의의 길이의 동영상을 생성할 수 있습니다. "실험 결과는 EMO가 설득력 있는 말하기 비디오뿐만 아니라 다양한 스타일의 노래 애니메이션도 생성할 수 있음을 보여줍니다. 이는 표현력과 현실성 면에서 기존 방법론을 크게 초월합니다."라고 연구보고서에 나와 있습니다.

EMO가 소개한 발전은 개인화된 비디오 콘텐츠가 단일 사진과 오디오 클립으로 쉽게 합성될 수 있는 미래를 암시합니다. 그럼에도 불구하고, 이러한 기술이 사칭이나 잘못된 정보 전파에 악용될 가능성에 대한 윤리적 우려가 남아 있습니다. 연구자들은 합성 비디오 탐지를 위한 방법을 탐색하는 데 전념하고 있습니다.

오픈 소스가 기업 보안을 어떻게 혁신하고 있는지: 스타트업 필리그란이 협력적 위협 방어를 선도하는 방법 알아보기

Slice는 기업의 주식 분배 및 추적을 간소화하는 것을 목표로 합니다.

Most people like

Up Learn

1.4M

A Level에서 A* 성과를 달성하는 비결이 AI와 인지 과학의 강력한 융합 덕분에 그 어느 때보다도 더 쉽게 접근할 수 있게 되었습니다. 이러한 최첨단 분야는 학습과 기억력을 향상시키는 혁신적인 전략과 도구를 제공하여, 학업에서의 뛰어난 성과를 위한 길을 열어줍니다. 이들 통찰력을 활용하면 학생들은 자신의 잠재력을 최대한 발휘하고 학업에서 우수성을 이룰 수 있습니다.

인공지능 AI Course

seospark.io

21.6K

온라인 존재의 잠재력을 최대한 활용하세요! 저희 강력한 SEO 도구는 키워드 연구와 효과적인 콘텐츠 전략 개발을 위해 설계되었습니다. 경험이 풍부한 디지털 마케터이든 시작하는 단계든 상관없이, 저희 직관적인 플랫폼은 영향력 있는 키워드를 파악하고 타겟 오디언스와 공감할 수 있는 매력적인 콘텐츠를 작성하는 데 필요한 인사이트를 제공합니다. 데이터 기반 전략을 활용하여 SEO 실력을 높이고 유기적 트래픽을 유도하세요. 더 나은 가시성과 향상된 검색 순위를 위해 오늘부터 최적화를 시작해 보세요!

키워드 조사 AI SEO Assistant

Massed Compute

69.8K

GPU 대여를 제공하는 클라우드 공급자의 장점을 발견해 보세요. 이는 다양한 컴퓨팅 작업에 적합합니다. 기계 학습, 비디오 렌더링 또는 복잡한 시뮬레이션을 위한 향상된 처리 성능이 필요하다면, GPU 대여는 유연하고 비용 효율적인 솔루션을 제공합니다. 이러한 서비스가 어떻게 귀하의 프로젝트를 향상시키고 오늘날 데이터 중심의 환경에서 혁신을 촉진할 수 있는지 알아보세요.

클라우드 컴퓨팅 AI Analytics Assistant

ContextQA

25.9K

수동 테스트 보고 프로세스를 간소화하여 소프트웨어 품질 향상 수동 테스트 보고 자동화가 어떻게 소프트웨어 품질을 획기적으로 향상시킬 수 있는지 알아보세요. 지루한 작업을 없애고 효율성을 높임으로써 강력한 애플리케이션 개발 및 우수한 사용자 경험 제공에 더 많은 집중을 할 수 있습니다.

인공지능 Other

Find AI tools in YBX