미스트랄, 새로운 오픈 소스 모델로 GPT-3.5 성능 초월하며 AI 커뮤니티를 놀라게 하다

미스트랄은 유럽 역사상 가장 많은 투자금을 유치한 스타트업으로, 프랑스의 오픈 소스 AI 모델 및 대형 언어 모델(LLM)에 중점을 둔 회사입니다. 최근, 이 회사는 새로운 모델인 Mixtral 8x7B를 출시하며 AI 커뮤니티에서 큰 반향을 일으켰습니다. 이 혁신적인 모델은 다양한 전문화를 갖춘 모델을 결합한 "전문가 혼합" 접근 방식을 활용하여 여러 작업에서 뛰어난 성능을 발휘합니다.

미스트랄은 Mixtral 8x7B를 블로그 포스트나 데모 영상 없이 토렌트 링크로 낮은 프로필로 온라인에 공개하며 즉각적인 관심을 불러일으켰습니다. 초기 사용자 및 AI 인플루언서들은 X와 LinkedIn과 같은 플랫폼에서 이 모델에 대한 관심을 모았습니다.

오늘, 미스트랄은 Mixtral 8x7B의 성능 벤치마크를 상세히 설명한 블로그 포스트를 발표했습니다. 여기서 이 모델은 OpenAI의 독점 GPT-3.5와 Meta의 Llama 2를 능가하는 성능을 보였습니다. 회사는 모델 학습에 있어 CoreWeave와 Scaleway와 협력하였고, Mixtral 8x7B가 Apache 2.0 라이센스 하에 상업적 사용이 가능하다고 확인했습니다.

초기 사용자는 이미 Mixtral 8x7B를 다운로드하였으며, 많은 이들이 그 성능에 감명받았습니다. 이 모델은 컴팩트한 디자인 덕분에 새로운 M2 Ultra CPU를 탑재한 Apple Mac 컴퓨터를 비롯한 표준 머신에서 로컬 실행이 가능합니다.

특히, 펜실베이니아 대학교 와튼 스쿨의 교수이자 AI 인플루언서인 에단 몰릭은 X에서 Mixtral 8x7B가 "보안 장치가 없는 것 같다"고 강조했습니다. 이 특성은 OpenAI의 엄격한 콘텐츠 정책에 불만을 가진 사용자들에게 매력적일 수 있으며, 다른 모델에서 종종 “불법” 또는 NSFW로 분류되는 콘텐츠 생성이 가능하게 합니다. 그러나 이러한 보안 장치 부족은 정책 입안자와 규제 기관에 도전 과제가 될 수 있습니다.

Mixtral 8x7B는 HuggingFace에서 직접 탐색할 수 있으며(링크 제공에 감사드립니다, Merve Noyan), HuggingFace 구현 버전은 보안 장치가 포함되어 있습니다. 이는 논란이 있는 프롬프트로 테스트할 때 나폴람 제작 지침 제공을 거부함으로써 입증되었습니다.

더불어, 미스트랄은 더 강력한 모델을 개발 중입니다. HyperWrite AI의 CEO인 맷 슈머는 X에서 미스트랄-미디엄의 알파 버전을 애플리케이션 프로그래밍 인터페이스(API)에 출시했다고 언급하며, 더 크고 진보된 모델이 곧 출시될 것임을 나타냈습니다.

중요한 재정적 지원을 받아 미스트랄은 A16z에 의해 주도된 4억 1500만 달러 규모의 시리즈 A 자금 조달을 완료하였고, 이는 20억 달러의 가치를 달성한 것입니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles