메타의 이미지 생성 모델 확장: 비디오 및 향상된 이미지 편집 기능 추가

Home AI 뉴스 메타의 이미지 생성 모델 확장: 비디오 및 향상된 이미지 편집 기능 추가

메타는 최신 이미지 생성 기반 모델인 Emu(Expressive Media Universe)를 출시하며 생성형 AI 분야에서 큰 발전을 이루었습니다. 이 강력한 모델은 텍스트에서 동영상을 생성하는 능력과 정교한 이미지 편집 기능을 갖추고 있습니다. Emu의 기술은 9월 메타 커넥트 행사에서 처음 공개되었으며, 메타의 소셜 미디어 플랫폼 전반에 걸쳐 다양한 생성형 AI 경험의 기초를 제공합니다. 예를 들어, 인스타그램의 이미지 편집 도구를 개선하여 사용자가 사진의 시각적 스타일이나 배경을 원활하게 변경할 수 있게 합니다. Emu는 OpenAI의 ChatGPT와 유사하게 작동하는 사용자 보조 플랫폼인 메타 AI에 통합되어 있습니다.

새로운 Emu 비디오 모델은 자연어 텍스트, 이미지 또는 이 둘의 조합을 기반으로 동영상을 생성하는 이중 기능으로 두드러집니다. 이전의 Make-a-Video와 같은 모델이 다섯 가지 확산 모델에 의존했던 것과 달리, Emu 비디오는 오로지 두 가지 모델만을 사용하여 더 간소화된 방식으로 작동합니다. 이 과정은 두 개의 주요 단계로 나뉘며, 첫째, 텍스트 프롬프트를 기반으로 이미지를 생성하고 둘째, 텍스트와 이미지 프롬프트에 의해 안내되는 동영상을 만듭니다. 이 간소한 방법론은 동영상 생성 모델의 효율적인 훈련을 가능하게 합니다. 사용자 연구에서 Emu 비디오는 Make-a-Video보다 우수한 성능을 보였으며, 96%의 참가자가 품질을 선호하고 85%가 텍스트 프롬프트에 더 충실하다고 응답했습니다. 또한, Emu 비디오는 사용자가 업로드한 이미지를 특정 텍스트 프롬프트에 따라 애니메이션화할 수 있습니다.

또한 Emu Edit의 도입으로 자연어 지시를 활용한 이미지 편집 기능이 강화되었습니다. 사용자는 이미지를 업로드하고 원하는 변경 사항을 지정할 수 있습니다. 예를 들어, 푸들을 제거하고 빨간 벤치로 교체하는 등의 요청을 입력하면 됩니다. 기존의 AI 기반 이미지 변경 도구들, 예를 들어 Stable Diffusion 기반의 ClipDrop 및 Runway의 이미지 편집 기능은 과도한 수정이나 편집 작업에서 저조한 성과를 보인다는 메타 연구진의 언급이 있었습니다.

메타는 블로그 글을 통해 "신뢰할 수 있는" 이미지를 만드는 것뿐만 아니라 사용자의 특정 요청과 관련된 픽셀만 정확하게 수정하는 데 집중해야 한다고 강조했습니다. 팀은 컴퓨터 비전 작업을 이미지 생성 모델의 지침으로 통합하는 것이 편집 과정에서 유례없는 통제를 제공한다는 것을 발견했습니다.

Emu Edit 개발을 위해 메타는 입력 이미지, 상세한 작업 설명, 목표 출력 이미지로 구성된 1천만 개의 합성 이미지로 구성된 포괄적인 데이터셋을 활용했습니다. 이를 통해 모델은 사용자 지침을 밀접하게 준수하면서 원본 이미지의 무관한 요소의 무결성을 유지할 수 있습니다.

Emu Edit의 기능을 탐색하고 싶은 분들은 Hugging Face에서 생성된 이미지를 확인할 수 있습니다. 또한 메타는 이미지 편집 모델의 추가 테스트를 촉진하기 위한 새로운 벤치마크인 Emu Edit 테스트 세트를 도입했습니다. 이 세트는 배경 변경 및 객체 제거와 같은 일곱 가지 이미지 편집 작업을 포함하여 정교한 이미지 편집 기술의 발전을 위한 기초를 마련하고 있습니다.

AI 시스템, 최소한의 데이터 자원으로 희귀 질병을 신속하게 식별하다.

OpenAI, CEO 샘 알트먼 해임: AI 미래에 대한 의미는?

Most people like

FliFlik Voice Changer

103K

목소리를 변환하세요: 게임 및 스트리밍을 위한 궁극의 목소리 변환기 게임 및 스트리밍 경험을 한층 향상시킬 완벽한 목소리 변환기를 만나보세요. 관객을 즐겁게 하거나 익명성을 추가하거나 단순히 재미를 느끼고 싶다면, 저희의 최고 평점 목소리 변환기가 여러분의 퍼포먼스를 향상시키고 상호작용을 흥미롭게 유지합니다. 다양한 사용자 맞춤 효과와 편리한 기능을 통해 게임 스타일이나 스트리밍 페르소나에 맞는 독특한 사운드를 생성할 수 있습니다. 끝없는 가능성을 탐색하고 콘텐츠를 한 단계 끌어올리세요!

보이스 체인저 AI Voice Changer

PromptPal

62.3K

프롬프트팔과 함께 창의력을 발휘하세요. 다양한 AI 프롬프트를 탐색하고 공유할 수 있습니다. 우리의 커뮤니티에 참여하여 상상력을 자극하고 창의적인 프로젝트를 한층 발전시켜 보세요.

AI 프롬프트 Other

Morise.ai

YouTube 창작자를 위해 특별히 설계된 AI 기반 툴박스로 여러분의 창의력을 발휘하세요. 이 혁신적인 도구 세트는 영상 제작을 향상시키고, 콘텐츠 전략을 최적화하며, 관객 참여를 높여 채널 성장의 길을 더욱 쉽게 만들어 줍니다. 영상 제작의 미래를 받아들이고 YouTube의 꿈을 실현해 보세요!

유튜브 AI AI YouTube Assistant

YouCam AI & AR Business Solutions

5.4M

AI와 AR 솔루션이 뷰티, 패션, 스킨케어 산업에서 변화시키는 힘을 발견하세요. 기술이 계속 발전함에 따라, 이러한 혁신적인 도구들은 브랜드가 소비자와 소통하고, 경험을 향상시키며, 맞춤형 제공을 하는 방식을 재구성하고 있습니다. 인공지능과 증강 현실이 제품 발견, 가상 착용, 맞춤 추천을 혁신하며, 보다 몰입감 있고 사용자 친화적인 쇼핑 경험을 만들어가는 과정을 탐험해 보세요. 경쟁 환경에서 앞서 나가고, 브랜드의 성장과 성공을 위한 AI와 AR의 잠재력을 활용하세요.

AR 뷰티 기술 Life Assistant

Find AI tools in YBX