2023년이 끝나갈수록 생성 AI 기술의 발전이 가속화되고 있으며, 전통적인 겨울 휴가 시즌의 둔화 현상을 이겨내고 있습니다.
오늘, 테크 대기업 마이크로소프트의 첨단 연구 부서인 Microsoft Research가 Phi-2 소형 언어 모델(SML)을 공개했습니다. 이 혁신적인 텍스트-투-텍스트 AI는 노트북과 모바일 장치에서도 원활하게 작동할 수 있을 만큼 컴팩트하다는 점이 X에 게시된 글에서 강조되었습니다.
Phi-2는 27억 개의 파라미터(인공 신경망 간 연결)를 갖추고 있어, 70억 개의 파라미터를 지닌 메타의 Llama 2-7B 및 같은 규모의 Mistral-7B 등 더 큰 모델과 동등한 성능을 제공합니다. 흥미롭게도, Phi-2는 구글의 새로운 Gemini Nano 2 모델을 능가하며, 이 모델은 추가로 5억 개의 파라미터를 포함하고 있습니다. 게다가 Phi-2는 Llama 2에 비해 응답의 독성 및 편향이 적습니다.
마이크로소프트는 구글의 논란이 되는 데모 비디오를 언급하며, 다가오는 Gemini Ultra 모델이 복잡한 물리 문제를 해결하고 학생들의 실수를 교정했다고 주장하는 내용을 비교했습니다. 흥미롭게도, Phi-2도 이 물리적 질문에 정확히 답변하며 올바른 해답을 제공했지만, Gemini Ultra보다 현저히 작은 모델입니다.
그러나 중요한 제한사항이 있습니다: Phi-2는 현재 마이크로소프트 리서치 맞춤 라이선스 아래에서 연구 목적으로만 사용이 허가되어 있으며, 상업적 사용은 명시적으로 금지되어 있습니다. 따라서 이 모델을 기반으로 제품을 개발하고자 하는 기업들은 현재로서는 불가능합니다.