최신 Hugging Face 순위에 따르면 혁신적인 오픈 소스 언어 모델이 세계 최고의 모델로 인정받았습니다. 이 모델은 복잡한 인공지능 및 머신러닝 문제 해결에 집중하는 스타트업 Abacus AI가 오늘 공개한 "Smaug-72B"입니다. Smaug-72B는 알리바바 그룹의 연구팀이 몇 달 전 소개한 또 다른 주요 언어 모델 "Qwen-72B"의 세밀하게 조정된 버전입니다.
특히 Smaug-72B는 OpenAI의 GPT-3.5와 Mistral Medium이라는 두 가지 최첨단 독점 언어 모델을 여러 주요 벤치마크에서 능가했습니다. 많은 평가에서 Qwen-72B보다도 상당한 차이로 우수성을 입증했습니다.
Hugging Face의 오픈 LLM 리더보드에 따르면, Smaug-72B는 모든 주요 평가에서 평균 점수가 80을 초과한 첫 번째이자 유일한 오픈 소스 모델로 기록되었습니다. 아직 인간 수준의 성능을 나타내는 90-100 점 평균에는 도달하지 않았지만, 이 모델의 출시는 오픈 소스 AI 분야의 잠재적 변화를 시사합니다. 이는 오랫동안 접근이 어려웠던 주요 기술 기업들의 역량에 도전할 가능성을 보여줍니다.
오픈 소스의 장점
Abacus AI의 CEO Bindu Reddy는 X.com에 게시한 글에서 "Abacus AI의 Smaug-72B가 평균 점수 80을 달성한 최초의 모델로 LLM 리더보드를 선도하고 있습니다."라고 밝혔습니다. "우리의 다음 목표는 이러한 기술을 연구 논문으로 발표하고 Mistral의 최상위 모델인 Miqu(LLama-2의 70B 세밀 조정 버전)에 적용하는 것입니다. 우리가 사용한 기술은 추론 및 수학 능력을 특별히 향상시키며, 이로 인해 뛰어난 GSM8K 점수를 기록하고 있습니다! 앞으로의 논문에서도 더 많은 통찰을 제공할 것입니다."
Smaug-72B는 전반적인 성능뿐 아니라 추론 및 수학 작업에서의 뛰어난 능력으로도 주목받고 있습니다. 이에 Abacus AI가 적용한 특정 세밀 조정 기술이 일반적으로 대형 언어 모델에서 나타나는 약점을 보완하여 성능을 개선했습니다.
기타 주목할 만한 오픈 소스 개발에는 Qwen에서 출시한 Qwen 1.5가 있습니다. Qwen 1.5는 0.5B에서 72B 파라미터에 이르는 소형이면서도 강력한 언어 모델 모음으로, Mistral Medium과 GPT-3.5와 같은 인기 독점 모델을 초월하며, 32K의 문맥 길이와 다양한 도구와의 호환성으로 빠른 로컬 추론을 지원합니다. 또한 Qwen은 Google의 Gemini Ultra와 OpenAI의 GPT-4V에 도전하는 새로운 대형 비전 언어 모델인 Qwen-VL-Max를 소개했습니다.
AI의 미래에 대한 시사점
Smaug-72B와 Qwen 1.5의 등장은 AI 커뮤니티와 더 넓은 기술계에서 큰 화제를 불러일으켰습니다. 많은 전문가들은 Abacus AI와 Qwen의 오픈 소스 AI에 대한 기여를 평가하며, 지난 해 동안의 빠른 발전을 강조했습니다.
AI 인플루언서이자 분석가인 Sahar Mor는 LinkedIn에서 "1년 전만 해도 우리는 Dolly와 같은 모델에 흥분했었다는 게 믿어지지 않는다."라며 오픈 소스 모델의 빠른 발전을 회상했습니다.
Smaug-72B와 Qwen 1.5는 Hugging Face에서 공공 접근이 가능하며, 사용자는 이를 다운로드 받고 자유롭게 활용 및 수정할 수 있습니다. Abacus AI와 Qwen은 또한 llmsys 인간 평가 리더보드에 자신의 모델을 제출할 계획이며, 이는 인간과 유사한 작업에서 언어 모델 성능을 측정하는 새로운 지표입니다. 그들은 더 많은 오픈 소스 모델 생산과 다양한 응용 프로그램 탐색을 목표로 한 향후 프로젝트를 암시했습니다.
Smaug-72B와 Qwen 1.5는 최근 몇 달 동안의 오픈 소스 AI의 급속한 진화를 보여줍니다. 이들은 주요 기술 기업의 지배에 도전하며 개발자와 연구자에게 더 많은 기회를 제공하는 혁신과 민주화의 물결을 상징합니다. Smaug-72B가 Hugging Face 리더보드에서의 리더십을 유지할지는 두고 봐야겠지만, 오픈 소스 AI가 상당한 모멘텀을 얻고 있다는 것은 분명합니다.