Сегодняшние инструменты упрощают создание приложений на основе искусственного интеллекта, однако многие разработчики избегают сложностей, связанных с хостингом моделей. Выбор между такими опциями, как GPT-4 от OpenAI, Llama 3 от Meta, Gemini от Google или различные открытые модели – это одна задача, но развертывание этих моделей представляет собой совершенно новые трудности.
Эта сложная работа может разочаровать разработчиков и подавить их предпринимательские амбиции. Однако Microsoft предлагает решение, которое позволяет разработчикам сосредоточиться на креативности, а не на технических препятствиях. Их предложение Models-as-a-Service (MaaS) похоже на облачные сервисы и позволяет пользователям оплачивать доступ к моделям, а не управлять инфраструктурой. Эта услуга доступна через Microsoft AI Azure Studio.
«Если вы когда-либо разворачивали модель, то знаете, как сложно сочетать версии Pytorch с аппаратными спецификациями», — объясняет Сет Хуарез, ведущий менеджер программы платформы ИИ Microsoft. «MaaS устраняет эту сложность. Если у вас есть модель — либо открытая, либо созданная OpenAI — вы можете легко получить к ней доступ через наш каталог. Всего одним кликом вы получите готовую к работе конечную точку».
С помощью MaaS разработчики могут легко арендовать API для инференса и проводить дообучение на основе оплаты по мере использования, не прибегая к виртуальным машинам. Хуарез отмечает, что даже несмотря на то, что Microsoft предлагает более 1600 моделей с различными функциональными возможностями, цель MaaS — упростить интеграцию ИИ-функций в программное обеспечение разработчиков.
С момента запуска в 2023 году Microsoft сделала доступными через MaaS ряд моделей. Изначально были представлены модели, такие как Mistral-7B и Llama 2 от Meta. Недавно в ассортимент вошли TimeGen-1 от Nixtla и Core42 JAIS, а также ожидаются дополнительные модели от AI21, Bria AI, Gretel Labs, NTT Data, Stability AI и Cohere. Однако лишь малая часть моделей доступна в AI Azure Studio имеет статус MaaS.
Право модели на участие в программе часто определяется корпоративными партнерствами, хотя Хуарез признает, что у него нет полной информации о деталях этих сотрудничеств. Другие модели включаются, так как модификации API стандартизировали их сигнатуры функции для совместимости с MaaS. Однако более специализированные модели требуют применения других методов развертывания. «Вот почему некоторые классифицируются как Models-as-a-Service, в то время как другие можно интегрировать в собственный контейнер для управляемого инференса», — объясняет Хуарез.
Хуарез ожидает будущее, в котором разработчики смогут выбрать между двумя подходами — быть владельцем или арендатором. «В этой модели вы владеете всем контейнером и моделью и отвечаете за обслуживание, в то время как с MaaS мы управляем этим обслуживанием для вас. Чем больше моделей мы поддерживаем, тем больше вариантов аренды для разработчиков», — отмечает он.
MaaS не является новой концепцией, но демонстрирует значительный сдвиг в технологическом ландшафте. Хуарез считает, что динамика изменилась: вместо того чтобы технологические компании диктовали наши потребности, теперь потребители требуют конкретные функции и услуги. Эта эволюция была спровоцирована параллельным развитием исследований ИИ и коммерциализацией. «Мы наблюдаем инверсию, где пользователи теперь формируют спрос благодаря широкому использованию таких инструментов, как ChatGPT, что побуждает предприятия догонять и предлагать запрашиваемые возможности», — заключает он.