샤오아이스, "제로샷" 디지털 휴먼 기술 출시로 AI 직원 응용 프로그램 발전
2023년 7월 17일, 샤오아이스는 혁신적인 "제로샷" 디지털 휴먼 기술(제로샷 샤오아이스 신경 렌더링, 제로-XNR)을 공식 출시하며, 이를 기반으로 한 포괄적인 디지털 직원 제품도 선보였습니다. 이번 출시로 샤오아이스의 AI 디지털 직원 제품군이 확장되었습니다.
새로운 기술은 "대형 모델과 디지털 휴먼의 통합"이라는 샤오아이스의 기존 경로를 따릅니다. 1000억 개 이상의 파라미터를 갖춘 대형 모델과 디지털 휴먼 상호작용 툴을 활용하여, 제로-XNR은 디지털 직원 교육에 필요한 데이터와 시간을 대폭 줄이며, "1초 수준"의 맞춤화를 실현하고 실시간 상호작용을 가능하게 합니다. 이는 전 세계적으로 업계 최초의 성과입니다. 또한, 샤오아이스는 실제 인간 직원의 외모와 목소리를 정확히 재현하여 매우 현실감 있는 경험을 제공합니다.
디지털 직원 기능 향상을 위한 세 가지 주요 업그레이드
1. Z-XNR 기술: 제로샷 디지털 휴먼 기술과 TTS 음성 대형 모델을 결합한 Z-XNR은 고품질의 즉각적인 이미지와 음성 복제를 가능하게 합니다. 독창적인 교육 및 추론 알고리즘을 통해 디지털 휴먼은 개인화된 정밀한 시각적 표현을 제공합니다.
2. 업그레이드된 대형 모델 및 에이전트 프레임워크: 1000억 개 이상의 파라미터를 자랑하는 대형 모델 기반의 새로운 에이전트 프레임워크는 디지털 직원이 고객의 요구를 깊이 이해하고 다양한 비즈니스 시나리오에 적응할 수 있도록 돕습니다.
3. 투명한 오디오-비주얼 전송 시스템: 자사 개발한 WebRTC 엔진을 활용하여, 고품질의 저지연 오디오-비주얼 전송을 보장하며, 투명한 데이터 채널을 지원합니다. 이는 실시간 렌더링 경험을 향상시키고 사용자 상호작용의 유연성을 높입니다.
샤오아이스 팀은 "디지털 휴먼 + 대형 모델" 기술 혁신의 최전선에 있습니다. 이 기술의 성공적인 도입은 샤오아이스가 글로벌 디지털 휴먼 분야에서 선도적인 위치를 확고히 하는 데 기여하고 있습니다. 딥 뉴럴 네트워크, 자연어 처리, 음성 합성, AI 콘텐츠 생성 등의 기술을 통합하여 샤오아이스의 디지털 휴먼은 실제 사람과 거의 구별되지 않는 상호작용을 제공하며, 800밀리세컨드의 초저지연 피드백을 유지합니다. 이는 사용자가 효율적인 디지털 자산 관리와 디지털 휴먼 역할 구성을 가능하게 합니다.
다양한 비즈니스 요구 충족
샤오아이스의 제로샷 디지털 휴먼 기술은 중소기업에게 디지털 혁신을 위한 접근 가능하고 경제적인 경로를 제공하며, 디지털 휴먼 기술의 도입을 가속화하고 있습니다. 고객 기반은 중국 해운 그룹, 세쿼이아 차이나, 완커 그룹 등 다양한 분야의 저명한 기업들이 포함되어 있으며, 각자의 분야에서 실질적인 응용을 실현하고 있습니다.
자체 서비스 샤오아이스 디지털 직원 앱을 통해 사용자는 제로샷 디지털 휴먼의 자동화된 전체 맞춤화를 손쉽게 진행할 수 있어, 디지털 휴먼 응용 프로그램의 유연성과 광범위한 사용을 더욱 촉진합니다.
샤오아이스는 기술 혁신의 힘을 활용하여 디지털 휴먼의 도입을 촉진하고 산업 성장을 이끌며 다양한 분야가 효율적이고 안전하며 안정적인 디지털 상호작용을 달성할 수 있도록 지원하는 데 헌신하고 있습니다. 샤오아이스가 개발한 여러 기술은 국가 기관에 등록되어 권위 있는 인정을 받고 있으며, 이로써 기술, 전문성, 안전 및 준수 측면에서 회사의 강력한 기반을 강조합니다.
마이크로소프트 아시아 인터넷 엔지니어링 연구소에서 출발한 샤오아이스 AI 팀은 자연어 처리 및 컴퓨터 비전 분야를 전문으로 하는 독립 회사로 발전했습니다. 최첨단 기술을 갖춘 샤오아이스는 금융, 자동차, 부동산, 교육 등 다양한 산업에 성공적으로 서비스를 제공하는 AI 디지털 휴먼 제품의 풍부한 생태계를 구축했습니다.