앨런 인공지능 연구소, AI 개발의 '중대한 변화'를 이끌 '진정한 오픈 소스' LLM 공개

2014년 고(故) 마이크로소프트 공동 창립자 폴 앨런이 설립한 비영리 기관인 앨런 기관(AI2)이 OLMo를 소개했습니다. OLMo는 “진정한 오픈소스”와 “최첨단” 대안으로 설명되는 오픈소스 대형 언어 모델(LLM)입니다. 이 이니셔티브는 AI 개발의 중요한 변화를 의미합니다.

OLMo는 코드와 가중치만 공유하는 다른 모델들과 달리 훈련 코드, 훈련 데이터, 관련 도구 및 평가 도구 등 포괄적인 리소스를 제공합니다. Open Source Initiative 승인을 받은 라이선스 하에 출시된 OLMo의 모든 구성 요소는 아파치 2.0 라이선스 하에 제공됩니다.

이 발표는 오픈소스 AI가 빠르게 발전하고 있는 중대한 시점에 이루어졌습니다. 이는 OpenAI의 GPT-4 및 Anthropic의 Claude와 같은 독점 모델을 따라잡기 위한 노력으로, 파리 기반 스타트업 Mistral의 CEO는 최근 GPT-4 성능에 가까운 새로운 오픈소스 AI 모델이 등장했다고 확인했습니다. 또한, 메타는 코드 생성 모델 Code Llama 70B의 향상된 버전을 출시했으며, Llama LLM의 새로운 버전에 대한 기대가 커지고 있습니다.

그러나 오픈소스 AI 분야는 일부 연구자, 규제자, 정책 입안자들로부터 비판을 받고 있습니다. IEEE Spectrum의 한 논란의 여지가 있는 기고문에서는 “오픈소스 AI는 독특하게 위험하다”고 주장했습니다.

OLMo 프레임워크는 “완전한 개방” 접근 방식을 지지하며, 사전 훈련 데이터, 훈련 코드, 모델 가중치 및 평가 프로세스에 대한 완전한 접근을 제공합니다. 여기에는 추론 코드, 훈련 지표, 훈련 로그 및 훈련 과정 전반에 걸쳐 500개 이상의 체크포인트를 추적하는 Catwalk 프로젝트의 개발 평가 도구도 포함됩니다.

AI2 연구자들은 다양한 모델 크기, 모달리티, 데이터 세트 및 기능을 도입함으로써 OLMo를 지속적으로 개선할 계획입니다. AI2의 NLP 연구 선임 이사인 하나 하지시르지는 “현재 많은 언어 모델이 투명성이 부족하다”고 지적하며, “연구자들은 훈련 데이터에 접근하지 않으면 모델의 작동을 완전히 이해할 수 없다. 우리의 프레임워크는 연구자들이 LLM을 과학적으로 연구할 수 있게 하여 안전하고 신뢰할 수 있는 AI 개발에 필수적이다”라고 말했습니다.

AI2의 ML 과학자인 네이선 램버트는 OLMo가 LLM의 새로운 패러다임을 나타낸다고 강조했습니다. “OLMo는 ML 연구와 배포를 위한 새로운 접근법을 가능하게 하여, 과정의 모든 단계에서 과학적 개발을 촉진합니다”라고 그는 말했습니다.

오픈소스 AI 커뮤니티는 OLMo의 출시를 열렬히 환영했습니다. MosaicML와 Databricks의 수석 과학자인 조너선 프랭클은 이를 “오픈 사이언스를 위한 거대한 도약”이라고 칭찬했습니다. Hugging Face의 CTO는 소셜 미디어에서 이 모델이 “오픈소스 AI의 한계를 넓히고 있다”고 언급했습니다.

메타의 수석 과학자인 얀 르퀸은 AI2의 보도자료에서 “오픈 기초 모델은 생성 AI의 혁신을 주도하며, 활기찬 오픈소스 커뮤니티는 AI의 미래를 형성하는 데 핵심적이다”고 강조했습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles