중국 AI 유니콘의 340억 달러 LLM, Llama 2 및 Falcon 성능 초월

01.AI, 중국의 스타트업으로 AI 전문가인 카이푸 리가 이끌고 있는 이 회사는 340억 개의 매개변수를 자랑하는 대형 언어 모델(Yi-34B)을 공개했습니다. 이 모델은 메타의 700억 매개변수 Llama 2 및 기술 혁신 연구소의 180억 매개변수 Falcon을 능가합니다.

Yi-34B 모델은 다국어 지원이 가능하며, 중국어와 영어를 포함한 다양한 애플리케이션에 맞게 커스터마이징할 수 있습니다. 또한, 60억 매개변수의 소형 모델도 출시되어 AI/ML 기준에서 뛰어난 성능을 발휘하고 있습니다.

상업 AI 솔루션으로 확장

불과 8개월 전 설립된 01.AI는 이미 유니콘 기업으로 자리 잡았으며, OpenAI와 경쟁하기 위해 상업 제품을 계획하고 있습니다. 이는 특정 시장에 맞춘 생성 AI를 개발하는 글로벌 트렌드와 일치합니다.

AI 2.0 시대의 출범

2023년 3월에 설립된 01.AI는 고급 언어 모델을 통해 인간의 생산성을 높이고 경제 및 사회적 변화를 주도하며 AI 2.0 시대를 열고자 합니다. 이 회사는 AI 2.0의 변혁적 가능성을 강조하며, 모바일 인터넷보다 10배 더 큰 기회를 창출할 것이라고 주장합니다.

리 대표는 구글, 화웨이, 마이크로소프트 연구소 출신의 AI 전문 인력을 신속히 조직하였고, 초기 자금은 시노베이션 벤처스와 알리바바 클라우드 부문에서 지원받았으나 구체적인 금액은 공개되지 않았습니다.

성능 검증 및 오픈 연구 접근

초기 출시된 모델은 60억 및 340억 매개변수를 가진 두 개의 이중 언어 모델로, 각각 4,000개의 토큰 시퀀스로 훈련되었으며 추론 시 32,000개 토큰으로 확장 가능합니다. 340억 매개변수 모델은 Hugging Face 플랫폼에서 뛰어난 성능을 보여주며 일반 추론과 독해 과제에서 Llama 2를 초월하는 80.1 및 76.4점을 기록했습니다(각각 Llama 2는 71.9 및 69.4점).

Yi 시리즈 모델은 사용자에게 효율적인 솔루션을 제공하며, 컴퓨팅 자원을 절약하면서 비용 효율적인 커스터마이징이 가능합니다. 현재 이 모델은 학술 연구에 완전히 접근 가능하지만 상업적 사용은 명시적인 허가가 필요합니다.

미래 혁신의 지평선

01.AI의 모델은 중국 내 고객을 대상으로 하는 기관에 매력적인 기회를 제공하며, 이중 언어 챗봇 개발을 용이하게 합니다. 스타트업은 오픈 소스 모델의 언어 지원을 확대할 계획이며, OpenAI의 GPT 시리즈와 경쟁할 상업용 LLM을 개발 중입니다. 하지만 구체적인 내용은 아직 공개되지 않았습니다.

01.AI는 현지화된 LLM에 중점을 둔 AI 스타트업의 더 넓은 움직임의 일환입니다. 바이두는 최근 ERNIE 4.0을 출시하며 Canva 및 Adobe Creative Cloud와 경쟁할 창의적인 플랫폼 청두를 선보였습니다. 한국의 네이버도 한국어 및 문화적 맥락에 맞춘 HyperCLOVA X를 발전시키고 있으며, 인도의 릴라이언스 인더스트리도 다양한 언어를 포괄하는 LLM을 개발하기 위해 엔비디아와 협력하고 있습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles