NVIDIA, 새로운 8B AI 모델 공개: 높은 정밀도와 효율성, RTX 워크스테이션과 호환

NVIDIA, 미스트랄-네모-미니트론 8B 출시: 콤팩트한 언어 AI 모델

8월 21일, NVIDIA는 탁월한 정확성과 계산 효율성을 갖춘 콤팩트한 언어 AI 모델인 미스트랄-네모-미니트론 8B를 발표했습니다. 이 모델은 GPU 가속 데이터 센터, 클라우드 컴퓨팅 환경 및 워크스테이션에 최적화되어 있습니다.

지난달 미스트랄 AI와 협력하여 오픈 소스 미스트랄 네모 12B 모델을 출시한 후, 새롭게 출시된 미스트랄-네모-미니트론 8B는 80억 개의 매개변수를 특징으로 하며, NVIDIA RTX 그래픽 카드가 장착된 시스템을 위해 특별히 설계되었습니다. NVIDIA는 미스트랄 네모 12B 모델의 개선 작업으로 모델 크기를 줄이는 와이드 프루닝과 지식 증류를 포함한 연구를 진행했으며, 관련 내용은 "Compact Language Models via Pruning and Knowledge Distillation" 논문에 자세히 설명되어 있습니다.

프루닝 과정에서는 정확성에 미치는 영향이 적은 모델 가중치를 제거하여 신경망의 크기를 효과적으로 축소합니다. 증류 단계에서 연구 팀은 프루닝된 모델을 더 작은 데이터셋으로 재훈련해 프루닝으로 인한 정확성 저하를 성공적으로 완화했습니다.

성능 면에서 미스트랄-네모-미니트론 8B는 언어 모델을 위한 아홉 가지 주요 벤치마크에서 두드러진 장점을 보여주며, 언어 이해, 상식 추론, 수학적 추론, 요약, 정밀한 답변 생성 능력을 입증했습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles