구글은 Imagen 2를 포함한 이미지 생성 모델군의 중요한 업데이트를 발표했습니다. 이번 업데이트에는 사용자가 텍스트 프롬프트를 애니메이션 이미지로 변환할 수 있는 텍스트-투-라이브 기능이 추가되었습니다. 이 모델은 이제 일반 사용을 위한 이미지 편집 기능도 도입했습니다. 해당 기능에는 인페인팅(inpainting), 아웃페인팅(outpainting), 디지털 워터마크 추가가 포함됩니다.
구글 클라우드 넥스트 컨퍼런스에서 발표된 Imagen 2의 텍스트-투-라이브 기능은 초당 24프레임으로 애니메이션 GIF를 생성하며, 해상도는 360x640 픽셀, 지속 시간은 4초입니다. 구글은 이 기능의 지속적인 개선 계획을 밝혔습니다.
언론 브리핑에서 구글 클라우드 CEO 토마스 쿠리안은 "정적인 이미지 대신 차량과 같은 객체의 짧은 애니메이션을 볼 수 있습니다. 특히 미디어 및 광고 분야의 조직들이 사용자 참여를 높이기 위해 이 기술을 도입하고 있습니다."라고 설명했습니다.
Imagen 2는 다양한 카메라 앵글과 동작으로 이미지를 생성하며 애니메이션 전반에 걸쳐 일관성을 유지합니다. 또한, 생성 AI와 관련된 주요 우려 사항을 해결하기 위해 안전 필터와 디지털 워터마크를 포함하고 있습니다.
새로 공개된 이미지 편집 기능을 통해 사용자는 사진에서 요소를 추가하거나 제거할 수 있으며, 이는 Adobe Photoshop의 생성 채우기 또는 콘텐츠 인식 도구와 유사합니다. 사용자들은 또한 더 넓은 시야를 위해 이미지 경계를 확장할 수 있습니다.
이 업데이트는 구글의 전면 관리 클라우드 AI 플랫폼인 Vertex AI에 관한 발표의 일환입니다. 2023년 출시된 Imagen 2는 자연어 프롬프트에서 사진처럼 사실적이고 고해상도의 이미지를 생성하기 위해 구글 딥마인드에서 개발되었습니다. 이 모델은 OpenAI의 DALL-E, Midjourney, Adobe Firefly와 같은 다른 선도 모델들과 경쟁하며, 기업들이 브랜드 가이드라인 및 거버넌스 표준에 부합하는 이미지를 제작하도록 돕는 것을 목표로 하고 있습니다.