미스트랄 AI는 언어와 비전 처리 기능을 통합한 첫 번째 모델인 Pixtral 12B를 출시하며 멀티모달 AI 분야에 첫 발을 내딛었습니다. 이번 개발로 미스트랄은 OpenAI와 Anthropic 같은 주요 기업들과 경쟁할 수 있는 위치에 있습니다.
현재 Pixtral 12B는 공개 웹에서 사용할 수 없지만, 개발자들은 Hugging Face나 GitHub에서 소스 코드를 다운로드하여 개별 테스트를 진행할 수 있습니다. 전통적인 AI 출시 프로토콜에서 벗어나, 미스트랄은 사용자들이 모델 파일을 다운로드할 수 있는 토렌트 링크를 먼저 공유했습니다.
개발자 관계 책임자인 소피아 양은 X 게시물을 통해 모델이 곧 미스트랄의 웹 챗봇을 통해 제공될 예정이며, 개발자들이 이 기능을 실험할 수 있다고 발표했습니다. 또한, Pixtral 12B는 미스트랄의 La Platforme에 통합되어 회사의 모델에 접근할 수 있는 API 엔드포인트를 제공합니다.
Pixtral 12B의 특징은 무엇인가요?
구체적인 학습 데이터는 공개되지 않았지만, Pixtral 12B는 텍스트 프롬프트와 함께 이미지 분석을 촉진하는 것을 목표로 합니다. 사용자는 이미지를 업로드하거나 링크를 제공하여 해당 내용에 관련된 질문을 할 수 있습니다.
이 모델은 미스트랄의 첫 번째 멀티모달 모델로, OpenAI와 Anthropic의 유사 기능이 이미 존재한다는 점을 유념해야 합니다. Pixtral의 독특한 기능에 대해 질문을 받자, 양은 다양한 크기의 임의 이미지를 본래적으로 처리할 수 있다고 강조했습니다.
X에서 초기 테스트를 진행한 사용자들은 24GB 모델이 40개의 레이어, 14,336개의 숨겨진 차원, 32개의 주의 헤드를 포함하는 강력한 아키텍처를 갖추고 있다고 보고했습니다. 전용 비전 인코더는 최대 해상도 1024×1024의 이미지를 지원하며, 고급 이미지 분석을 위한 24개의 숨겨진 레이어를 특징으로 합니다.
미스트랄은 API를 통해 모델을 출시할 준비를 하면서, 콘텐츠 및 데이터 분석과 같은 비전 애플리케이션의 잠재력이 더욱 명확해질 것입니다. 이 오픈 모델의 정확한 성능은 아직 확정되지 않았지만, AI 분야에서 미스트랄의 야심찬 진로를 상징합니다.
작년 설립 이후 미스트랄은 OpenAI 같은 산업 선두 주자와 경쟁하기 위해 모델 파이프라인을 빠르게 발전시켜 왔습니다. 또한 Microsoft, AWS, Snowflake와 같은 주요 기업과 전략적 파트너십을 체결하며 기술의 범위를 확장하고 있습니다. 최근 미스트랄은 64억 달러의 기업 가치를 평가받으며 6억 4천만 달러를 조달하였고, 고급 다국어 기능과 개선된 추론, 코드 생성 및 수학적 성능을 특징으로 하는 GPT-4 수준의 모델인 Mistral Large 2를 소개했습니다.
이와 더불어, 미스트랄은 220억 파라미터를 가진 스팟 믹스 모델인 Mixtral과 오픈 웨이트 코딩 모델인 Codestral을 출시했으며, 수학적 추론과 과학적 발견에 맞춘 모델도 함께 선보였습니다.