Salesforce представила революционную модель искусственного интеллекта, способную изменить ландшафт мобильного AI. Новая модель xLAM-1B, получившая название "Tiny Giant", включает всего 1 миллиард параметров, но превосходит более крупные модели в задачах вызовов функций, обгоняя таких гигантов, как OpenAI и Anthropic.
Это интересное достижение исследовательской группы Salesforce AI связано с их инновационной стратегией подготовки данных. Команда разработала APIGen, автоматизированный процесс, созданный для производства высококачественных, разнообразных и проверяемых наборов данных, специально для обучения AI в сценариях вызовов функций.
"Мы доказали, что модели, обученные на наших тщательно подобранных наборах данных, даже имеющие всего 7 миллиардов параметров, демонстрируют лучшие результаты на Berkeley Function-Calling Benchmark, превосходя несколько моделей GPT-4," отметили исследователи. "Особенно примечательно, что наша модель с 1 миллиардом параметров обходит как GPT-3.5 Turbo, так и Claude-3 Haiku."
Эффективный AI
Компактный размер модели xLAM-1B особое значение имеет для мобильных приложений, где более крупные модели становятся непрактичными. Это достижение имеет огромный потенциал для корпоративного AI, позволяя создавать более мощные и отзывчивые AI-ассистенты, способные работать на смартфонах и устройствах с ограниченными вычислительными ресурсами.
Впечатляющая производительность модели обусловлена качеством и разнообразием обучающих данных. Технология APIGen использует 3,673 исполняемых API в 21 категории, при этом каждая единица данных проходит строгий трехступенчатый процесс верификации: проверка формата, функциональное выполнение и семантическая проверка.
Этот метод указывает на решительный поворот в стратегии развития AI. В то время как многие компании стремятся создать все более крупные модели, Salesforce демонстрирует, что приоритет на качестве данных может привести к созданию более эффективных и мощных AI-систем. Подчеркивая важность подготовки данных, а не размера модели, Salesforce разработала модель, способную выполнять сложные задачи с гораздо меньшим количеством параметров, чем у конкурентов.
Вызов статус-кво AI
Положительные последствия этого достижения выходят за рамки Salesforce. Доказав, что более мелкие, но эффективные модели могут конкурировать с крупными, Salesforce бросает вызов традиционным представлениям в секторе AI. Это может вдохновить новую волну исследований, сосредоточенных на оптимизации AI, а не на простом увеличении размера модели, что потенциально уменьшит огромные вычислительные ресурсы, обычно необходимые для сложных функций AI.
Кроме того, успех xLAM-1B может ускорить развитие приложений на устройствах. В настоящее время многие продвинутые функции AI зависят от облачных вычислений из-за их размера и сложности. Если более мелкие модели, такие как xLAM-1B, могут обеспечить аналогичные возможности, они смогут оснастить высокоэффективные AI-ассистенты, работающие непосредственно на устройствах пользователей, улучшая скорость ответа и снимая опасения по поводу конфиденциальности, связанных с облачными решениями.
Исследовательская группа сделала доступным свой набор данных из 60,000 высококачественных примеров вызовов функций, способствуя дальнейшему развитию в этой области. "Предоставляя этот набор данных, мы стремимся помочь исследовательскому сообществу и вдохновить на будущие достижения," отметили они.
Создавая будущее мобильного AI
Генеральный директор Salesforce Марк Бениофф похвалил это достижение в Twitter, подчеркивая потенциал "агентного AI на устройствах." Это открытие может обозначать значительный поворот в ландшафте AI, оспаривая мнение о том, что более крупные модели по своей сути лучше, и прокладывая путь для инновационных AI-приложений в ограниченных условиях.
Последствия этого достижения выходят за рамки текущих предложений Salesforce. С расширением использования edge computing и IoT-устройств потребность в надежном мобильном AI будет расти. Успех модели xLAM-1B может подтолкнуть новый тренд разработки, сосредоточенный на создании высокоэффективных моделей, оптимизированных для конкретных задач, уходя от традиционных монолитных структур. Эта эволюция может создать распределенную экосистему AI со специализированными моделями, сотрудничающими в сетях устройств, предлагая более эффективные, отзывчивые и защищенные AI-сервисы.
Кроме того, этот прогресс может демократизировать доступ к AI-возможностям, позволяя небольшим предприятиям и разработчикам создавать сложные приложения без обширных вычислительных ресурсов. Это также может помочь снизить опасения о влиянии AI на окружающую среду, так как меньшие модели требуют значительно меньше энергии для обучения и работы.
Когда отрасль будет оценивать последствия прорыва Salesforce, одно очевидно: в области AI даже небольшая модель может бросить вызов и, возможно, превзойти крупных конкурентов. Будущее AI может находиться не только в облаке — оно может быть прямо у вас в руках.