오늘날의 도구들은 AI 기반 애플리케이션의 생성 과정을 간소화하고 있지만, 많은 개발자들이 모델 호스팅의 복잡함을 회피하는 경우가 많습니다. OpenAI의 GPT-4, Meta의 Llama 3, Google의 Gemini 또는 다양한 오픈 소스 모델 중에서 선택하는 것도 어려운 일이지만, 이러한 모델을 배포하는 것은 또 다른 도전 과제가 됩니다.
이 복잡한 작업은 개발자들을 좌절하게 하여 그들의 창업 욕구를 억제할 수 있습니다. 그러나 Microsoft는 개발자들이 기술적인 장애물보다 창의성에 집중할 수 있도록 하는 솔루션을 제공합니다. 이들의 서비스인 Models-as-a-Service (MaaS)는 클라우드 서비스와 유사하여, 사용자가 인프라 관리 대신 모델 접근에 대한 비용만 지불할 수 있게 합니다. 이 서비스는 Microsoft의 AI Azure Studio를 통해 이용 가능합니다.
Microsoft AI 플랫폼의 수석 프로그램 매니저인 세스 후아레즈(Seth Juarez)는 "모델을 배포해본 경험이 있다면, 이는 Pytorch 버전과 하드웨어 사양의 복잡한 조합을 포함한다는 것을 알 것입니다. MaaS는 이 복잡성을 추상화합니다. 오픈 소스 모델이나 OpenAI가 만든 모델이 있다면, 우리의 카탈로그를 통해 쉽게 접근할 수 있습니다. 클릭만으로 즉시 사용할 수 있는 운영 엔드포인트를 생성할 수 있습니다."라고 설명합니다.
MaaS를 통해 개발자는 추론 API를 쉽게 임대하고, 가상 머신 없이 사용량 기반으로 미세 조정을 호스팅할 수 있습니다. 후아레즈는 Microsoft가 다양한 기능을 가진 1,600개 이상의 모델을 제공하지만, MaaS의 목표는 개발자들이 AI 기능을 소프트웨어에 쉽고 간편하게 통합할 수 있도록 하는 것이라고 언급합니다.
2023년 출시 이래 Microsoft는 MaaS를 통해 일부 모델을 제공하고 있으며, Mistral-7B와 Meta의 Llama 2 같은 모델이 처음 도입되었습니다. 최근 Nixtla의 TimeGen-1와 Core42 JAIS가 추가되어 AI21, Bria AI, Gretel Labs, NTT Data, Stability AI, Cohere의 추가 모델도 곧 출시될 예정입니다. 하지만 AI Azure Studio에서 이용 가능한 모델 중 소수만이 MaaS 모델로 분류됩니다.
모델 자격은 종종 기업 파트너십에 따라 달라지지만, 후아레즈는 이러한 협력의 구체적인 사항에 대한 통찰이 부족함을 인정합니다. 다른 모델들은 API 수정으로 MaaS 호환성을 위한 기능 시그니처가 표준화되어 포함됩니다. 그러나 더 전문화된 모델은 다른 방법으로 배포해야 합니다. 후아레즈는 "그래서 어떤 모델은 Models-as-a-Service로 분류되고, 다른 모델은 관리되는 추론을 위해 자체 컨테이너로 배포될 수 있습니다."라고 설명합니다.
후아레즈는 개발자들이 주택 소유자와 임차인처럼 두 가지 접근 방식을 선택할 수 있는 미래를 예상하고 있습니다. "이 모델에서 당신은 전체 컨테이너와 모델을 소유하고 유지 관리를 처리하지만, MaaS를 이용하면 우리는 그 관리를 대신 합니다. 지원하는 모델이 많아질수록 개발자들은 더 많은 임대 옵션을 갖게 됩니다."라고 그는 덧붙입니다.
MaaS는 새로운 개념은 아니지만 기술 생태계에서 중요한 변화를 보여줍니다. 후아레즈는 이제 기술 기업들이 우리의 필요를 지시하는 것이 아니라 소비자들이 특정 기능 및 서비스에 대한 요구를 vocalizing 하고 있다고 믿습니다. 이러한 진화는 AI 연구와 상업화의 평행한 발전에 의해 촉진되었습니다. "우리는 ChatGPT와 같은 도구의 광범위한 사용으로 인해 사용자가 수요를 주도하는 역전 현상을 목격하고 있으며, 이는 기업들이 적시에 요청된 경험을 제공하도록 촉구하고 있습니다."라고 그는 결론지었습니다.