미스트랄, AI 모델의 빠르고 손쉬운 맞춤화를 위한 새로운 미세 조정 도구 공개

파인튜닝은 대형 언어 모델(LLM)의 출력을 향상시키고 특정 기업의 요구에 맞추는 데 필수적입니다. 이를 통해 보다 정확하고 가치 있는 모델 응답을 생성할 수 있어 조직은 생성형 AI 애플리케이션의 효과를 극대화할 수 있습니다. 그러나 파인튜닝은 비용이 많이 들 수 있어, 일부 기업이 이러한 고급 기능을 누리는 데 장벽이 될 수 있습니다.

Mistral은 오픈소스 AI 모델 제공업체로서, 출시 14개월 만에 60억 달러의 가치를 거의 달성하며 파인튜닝 분야에 뛰어들었습니다. 그들의 새로운 AI 개발자 플랫폼, La Plateforme는 파인튜닝 프로세스를 간소화하고 교육 비용을 절감하며 진입 장벽을 낮추기 위해 설계된 맞춤형 도구를 제공합니다.

Mistral은 프랑스 남부의 강한 바람을 의미하는 이름으로 AI 분야에서 주목받으며, 지속적인 혁신과 상당한 자금 유치를 이끌어내고 있습니다. 최근 블로그 포스트에서 Mistral은 특정 도메인에 맞춰 소형 모델을 파인튜닝하면 성능을 향상시키고 배포 비용을 최소화하며 응용 속도를 가속할 수 있다고 강조했습니다.

Mistral 모델 맞춤화

Mistral은 강력한 LLM을 오픈소스 라이센스 하에 배포함으로써 소프트웨어의 자유로운 적응을 가능하게 했습니다. 또한 API 및 La Plateforme 개발자 플랫폼 등의 유료 서비스를 제공합니다. 이를 통해 사용자는 Mistral 모델을 복잡한 서버 세팅 없이도 API 호출을 통해 활용할 수 있습니다.

이제 고객은 La Plateforme에서 Mistral 모델을 맞춤화하고, GitHub의 Mistral 오픈소스 코드를 활용하거나, 맞춤 교육 서비스를 이용할 수 있습니다.

스스로 인프라에서 작업하고자 하는 개발자를 위해 Mistral은 경량 코드베이스인 mistral-finetune을 출시했으며, 이는 LoRA 패러다임을 활용해 가변 파라미터 수를 최소화합니다. Mistral은 “mistral-finetune으로 효율성이나 성능을 저해하지 않고 모든 오픈소스 모델을 당신의 인프라에서 파인튜닝할 수 있습니다.”라고 말합니다.

서버리스 파인튜닝에 관심 있는 이들을 위해 Mistral은 정제된 연구 개발 기법을 활용한 새로운 서비스를 제공합니다. LoRA 어댑터는 모델의 기본 지식을 보존하면서도 효율적인 배포를 가능하게 합니다.

Mistral은 이를 AI 애플리케이션 개발자들이 복잡한 과학적 방법론을 쉽게 접근할 수 있게 해주는 중요한 발전으로 설명하며, 신속하고 비용 효율적인 모델 맞춤화를 지원합니다. 파인튜닝 서비스는 Mistral의 73억 파라미터 모델인 Mistral 7B 및 Mistral Small과 호환됩니다. 현재 사용자는 Mistral API를 통해 즉각적인 맞춤화를 진행할 수 있으며, 향후 몇 주 내에 추가 모델을 소개할 계획입니다.

또한, Mistral의 맞춤형 교육 서비스는 독점 데이터를 사용하여 AI 모델을 특정 애플리케이션에 최적화합니다. 이 과정에선 전문 지식을 통합하기 위한 최신 기법인 지속적인 프리트레인 방식이 활용됩니다.

이 새로운 제공 사항을 기념하기 위해 Mistral은 6월 30일까지 진행되는 AI 파인튜닝 해커톤을 개최하여 개발자들이 스타트업의 혁신적인 파인튜닝 API를 실험할 수 있도록 권장합니다.

Mistral의 급속한 성장과 혁신

2023년 4월 Google DeepMind와 Meta의 전 직원인 아서 맨슈, 기욤 람플, 티모티 라크루아에 의해 설립된 Mistral은 빠른 성장을 기록하고 있습니다. 이 회사는 유럽 역사상 최대인 1억 1천8백만 달러의 시드 펀드를 확보하며 IBM과 같은 주요 기업들과 빠르게 협력 관계를 맺었습니다. 2월에는 Microsoft와 협업하여 Azure 클라우드를 통한 Mistral Large를 공개했습니다.

최근 SAP와 Cisco가 Mistral에 대한 지지를 발표하였고, 지난달 Mistral은 자사의 첫 코드 중심 LLM인 Codestral을 출시하며 모든 경쟁사를 능가한다고 주장했습니다. Mistral은 또한 6억 달러 규모의 펀딩 라운드에 근접하여 가치를 60억 달러로 높일 계획입니다.

OpenAI와 Meta의 Llama 3에 직접 대응하는 경쟁자로 자리 잡은 Mistral Large는 세계에서 두 번째로 강력한 상업적 언어 모델로, OpenAI의 GPT-4에 이어 주목받고 있습니다. 2023년 9월에 발표된 Mistral 7B는 여러 벤치마크에서 Llama를 초월하고, 코드 작업에서 CodeLlama 7B의 성능에 근접한다고 합니다.

다음 Mistral의 혁신은 무엇일까요? 곧 알게 될 것입니다.

Most people like

Find AI tools in YBX