구글, 110억 매개변수 제니 모델 공개: 이미지를 플레이 가능한 가상 세계로 변환하는 혁신

Home AI 뉴스 구글, 110억 매개변수 제니 모델 공개: 이미지를 플레이 가능한 가상 세계로 변환하는 혁신

구글 딥마인드 팀은 최근 110억 개의 매개변수를 가진 기초 세계 모델인 '제니(Genie)'를 발표했습니다. 이 혁신적인 기술은 단 하나의 이미지를 대화형 가상 세계로 변환할 수 있는 능력을 갖추고 있어, 인공지능이 비디오 게임 분야에 진입하는 중요한 순간을 의미합니다.

기존 모델과 달리, 구글 제니는 20만 시간의 비표시 인터넷 비디오로부터 학습하며, 감독 없는 훈련을 통해 풍부한 장면을 생성할 수 있습니다. 또한, 제니는 장면 내 주요 캐릭터를 행동 라벨 없이 식별하여 사용자와의 상호작용을 가능케 하며, 가상 환경 창출의 엄청난 잠재력을 보여줍니다.

제니의 핵심 기능은 세 가지 주요 구성 요소로 이루어져 있습니다: 잠재적 행동 모델, 비디오 토크나이저, 자회귀 동적 모델입니다. 이 요소들은 결합하여 사용자 상호작용을 풍부하게 하는 잠재적 행동 공간을 개발하고, 에이전트가 비디오에서 본 적 없는 행동을 모방할 수 있게 합니다.

더욱이 제니는 인간이 디자인한 스케치나 실제 이미지를 혁신적으로 통합할 수 있도록 지원합니다. 고급 텍스트-투-이미지 생성 모델을 활용하여 제니는 초기 프레임을 대화형 가상 우주로 변형하여 사용성을 크게 확장할 수 있습니다.

제니 팀의 책임자인 팀 록타셸은 제니가 인공지능의 일반화(AGI) 개발에 중대한 이정표가 되며, 대화형 생성 환경의 지형을 바꾸고 미래 AI 발전을 위한 기초를 다질 것이라고 강조합니다.

결론적으로, 구글 딥마인드는 제니 모델을 선보이며 비디오 게임 산업에 혁신적인 변화를 예고하고 있습니다. 단 하나의 이미지로부터 플레이 가능한 가상 세계를 생성하는 능력은 게임 산업에 AI가 광범위하게 통합될 미래를 나타냅니다.

구글 제니와 오픈AI 소라 비교: 인터랙티브 비디오 생성 모델에 대한 심층 분석 및 평가

소라의 복잡한 시각 콘텐츠 접근법: 시공간 패칭의 비밀을 밝혀내다

Most people like

Typed

29.9K

Typed는 분산된 문서를 통합하고 팀워크를 개선하며, 사용자에게 연구와 생산성을 높이는 강력한 협업 문서 도구입니다.

협업 문서 도구 AI Documents Assistant

Pionex

3.3M

안전성, 강력함, 완전 자동화를 결합한 최고의 암호화폐 거래 봇을 만나보세요. 우리의 최고의 선택으로 거래 효율성을 높이고 위험을 최소화하세요.

암호화폐 거래 AI Trading Bot Assistant

Luma AI Video Generator

93K

Luma AI 비디오 생성기로 텍스트와 이미지를 손쉽게 멋진 비디오로 변환하세요. 몇 초 만에 매력적인 비주얼 콘텐츠를 만들고 오늘 당신의 스토리텔링을 한 단계 높여보세요!

기타 Image to Video

AI Uncensored

수천 개의 검열 없는 AI 캐릭터와 함께하는 무제한 AI 메시징. 창의적이고 사적인 대화를 위해.

캐릭터 채팅 AI Character

Find AI tools in YBX