구글, 110억 매개변수 제니 모델 공개: 이미지를 플레이 가능한 가상 세계로 변환하는 혁신

구글 딥마인드 팀은 최근 110억 개의 매개변수를 가진 기초 세계 모델인 '제니(Genie)'를 발표했습니다. 이 혁신적인 기술은 단 하나의 이미지를 대화형 가상 세계로 변환할 수 있는 능력을 갖추고 있어, 인공지능이 비디오 게임 분야에 진입하는 중요한 순간을 의미합니다.

기존 모델과 달리, 구글 제니는 20만 시간의 비표시 인터넷 비디오로부터 학습하며, 감독 없는 훈련을 통해 풍부한 장면을 생성할 수 있습니다. 또한, 제니는 장면 내 주요 캐릭터를 행동 라벨 없이 식별하여 사용자와의 상호작용을 가능케 하며, 가상 환경 창출의 엄청난 잠재력을 보여줍니다.

제니의 핵심 기능은 세 가지 주요 구성 요소로 이루어져 있습니다: 잠재적 행동 모델, 비디오 토크나이저, 자회귀 동적 모델입니다. 이 요소들은 결합하여 사용자 상호작용을 풍부하게 하는 잠재적 행동 공간을 개발하고, 에이전트가 비디오에서 본 적 없는 행동을 모방할 수 있게 합니다.

더욱이 제니는 인간이 디자인한 스케치나 실제 이미지를 혁신적으로 통합할 수 있도록 지원합니다. 고급 텍스트-투-이미지 생성 모델을 활용하여 제니는 초기 프레임을 대화형 가상 우주로 변형하여 사용성을 크게 확장할 수 있습니다.

제니 팀의 책임자인 팀 록타셸은 제니가 인공지능의 일반화(AGI) 개발에 중대한 이정표가 되며, 대화형 생성 환경의 지형을 바꾸고 미래 AI 발전을 위한 기초를 다질 것이라고 강조합니다.

결론적으로, 구글 딥마인드는 제니 모델을 선보이며 비디오 게임 산업에 혁신적인 변화를 예고하고 있습니다. 단 하나의 이미지로부터 플레이 가능한 가상 세계를 생성하는 능력은 게임 산업에 AI가 광범위하게 통합될 미래를 나타냅니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles