Эксперты в области медиа и технологий утверждают, что открытые большие языковые модели (LLM) могут существенно повлиять на генеративный ИИ внутри компаний, возможно, даже больше, чем проприетарные модели, такие как ChatGPT от OpenAI или решения от Anthropic.
Несмотря на широкие эксперименты и множество пробных проектов с открытыми моделями, крупные компании медленно раскрывают их реальные применения. Чтобы устранить этот пробел, мы обратились к ведущим провайдерам открытых LLM, включая Meta, Mistral AI, IBM, Hugging Face, Dell, Databricks, AWS и Microsoft.
Наши запросы выявили 16 заметных случаев развертывания (см. список ниже). Хотя это число скромно, аналитики отрасли ожидают резкого увеличения применения открытых решений к концу этого года.
Задержки в принятии открытых LLM
Одна из причин медленного внедрения открытых моделей — это их недавнее появление. Meta запустила первую значимую открытое LLM, Llama, в феврале 2023 года, всего через три месяца после выхода ChatGPT от OpenAI в ноябре 2022 года. Модель Mixtral от Mistral AI, получившая высокие оценки на различных тестах, была представлена всего месяц назад.
В результате, настоящие развертывания только начинают появляться. Сторонники открытых технологий признают, что закрытые модели в настоящее время преобладают, но предсказывают, что разрыв будет сокращаться.
Проблемы с открытыми моделями
Существуют ограничения текущих открытых моделей. Амджад Масад, CEO стартапа Replit, отметил, что механизм обратной связи для разработки моделей неэффективен из-за сложности внесения улучшений. Однако многие могли недооценить масштаб экспериментов среди разработчиков открытых решений, которые создали тысячи производных моделей, некоторые показывающие равные или лучшие результаты по сравнению с закрытыми моделями в определенных задачах, таких как FinGPT и BioBert.
Ограниченная ценность публичных больших моделей для предприятий
По словам Мэтта Бейкера, старшего вице-президента по стратегии ИИ в Dell, "большие публичные модели не представляют никакой ценности для частных компаний". Бейкер объяснил, что эти модели, как правило, слишком обобщены и не способствуют легкой интеграции данных частных компаний, которые составляют около 95% всей работы ИИ в организациях.
В результате многие компании изучают открытые решения для поддержки клиентов и генерации кода, используя уникальные коды, часто несовместимые с общими закрытыми LLM.
Медленные шаги из-за корпоративных соображений
Эндрю Жардин из Hugging Face отметил, что компании часто колеблются с внедрением приложений LLM, поскольку они придают большое значение конфиденциальности данных, клиентскому опыту и этическим аспектам. Обычно компании сначала тестируют внутренние случаи использования, прежде чем переходить к внешним приложениям. Хотя закрытые модели сделали значительные шаги к концу 2023 года, внедрение открытых решений ожидается в этом году.
Несмотря на преимущества, некоторые предприятия находят открытые модели громоздкими. Использование проверенных API от таких провайдеров, как OpenAI, часто считается проще, чем управление вопросами лицензирования и управления открытым исходным кодом.
Устранение разрыва между открытыми и закрытыми моделями
Жардин подчеркнул, что грань между открытыми и закрытыми моделями становится все менее четкой. Например, многие компании, включая крупную фармацевтическую, используют закрытые LLM для внутренних задач и открытые модели для конкретных функций, таких как идентификация конфиденциальной информации. Этот выбор отражает стремление к большему контролю над данными.
Польза от внедрения открытого кода
По мере быстрого изменения факторов адаптации моделей и стоимости компании, вероятно, будут стремиться к гибкости, позволяющей переключаться между открытыми и закрытыми моделями для снижения рисков. Компании часто выбирают открытые модели, чтобы сохранить контроль над конфиденциальными данными, одновременно настраивая их для специализированных приложений.
Некоторые компании, такие как Intuit и Perplexity, уже разрабатывают слои оркестрации генеративного ИИ, позволяющие безшовно интегрировать различные модели для конкретных задач, независимо от их открытого или закрытого статуса. Хотя развертывание открытых моделей в широком масштабе может потребовать больше усилий, они могут предложить экономию в долгосрочной перспективе, особенно для организаций с существующей инфраструктурой.
Многие предприятия тихо используют открытые модели. Например, автомобильные компании и авиакомпании экспериментируют с приложениями на базе платформы Databricks, которая включает открытые LLM.
Проблемы в идентификации развертываний открытого кода
Определить подлинные случаи использования в бизнесе может быть сложно. Хотя многие разработчики и стартапы создают приложения с использованием открытых LLM, мы стремились выделить установленные предприятия с значительными приложениями. Мы определили предприятие как компанию с минимум 100 сотрудниками и сосредоточили внимание на конечных пользователях, а не на поставщиках LLM.
Определение "открытого кода" также вызывает трудности, как показано на примере Llama от Meta, который имеет ограниченную лицензию. Более того, хотя такие компании, как Writer, разработали свои собственные LLM, только некоторые модели являются открытыми, что усложняет классификацию.
Ниже приведены примеры зарегистрированных развертываний открытых LLM в бизнесе:
1. VMWare: Использует модель Hugging Face StarCoder для улучшенной генерации кода в саморазмещенной среде, обеспечивая безопасность проприетарного кода.
2. Brave: Приватно ориентированный браузер использует модель Mixtral 8x7B для своего разговорного помощника Лео.
3. Gab Wireless: Применяет модели Hugging Face для фильтрации сообщений с целью обеспечения безопасности детей, блокируя неподобающий контент.
4. Wells Fargo: Использует модель Llama 2 от Meta для различных внутренних приложений, улучшая ресурсы для сотрудников.
5. IBM: Интегрирует открытые LLM в своем приложении AskHR, которое помогает сотрудникам с вопросами по HR и также используется в новых консультационных услугах.
6. Премия Грэмми: Сотрудничает с IBM для "AI Stories", используя Llama 2 для генерации индивидуальных инсайтов и контента для поклонников.
7-9. Masters Tournament, Wimbledon, US Open: Используют технологии IBM для комментариев в реальном времени и генерации хайлайтов во время событий.
10. Perplexity: Стартап, занимающийся реинвенцией поиска, использует открытые LLM для суммирования ответов в своей поисковой системе.
11. CyberAgent: Применяет открытые LLM от Dell для языкового моделирования на японском языке, адаптированного к потребностям пользователей.
12. Intuit: Объединяет свои собственные LLM с открытыми моделями для улучшения возможностей функции Intuit Assist.
13. Walmart: Разрабатывает приложения для разговорного ИИ, первоначально используя открыту модель BERT от Google.
14. Shopify: Внедряет Llama 2 в Sidekick, инструменте ИИ, который упрощает задачи для владельцев бизнеса в сфере электронной коммерции.
15. LyRise: Стартап по подбору талантов, создающий чат-бота для рекрутинга, использует Llama для взаимодействия.
16. Niantic: Использует Llama 2 для создания взаимодействий персонажей в мобильной игре Peridot.
Несмотря на существующие сложности в определении и отслеживании этих развертываний, интерес к открытым LLM стремительно растет. По мере того как больше компаний исследует их потенциал, мы ожидаем увеличения числа публичных случаев использования. Мы будем продолжать обновлять этот список по мере поступления новой информации.