Snorkel AI анонсировала значительное обновление платформы Snorkel Flow. Стартап, образованный на базе Лаборатории ИИ Стэнфорда, представил важные улучшения своего флагманского продукта — Snorkel Flow. Эта платформа для разметки данных, фильтрации, кураторства и тонкой настройки ИИ теперь интегрируется с семейством моделей Google Gemini и новой моделью Llama 3 от Meta.
Запущенная в марте 2022 года, Snorkel Flow создана для упрощения разработки и внедрения индивидуальных ИИ-решений для предприятий. Она позволяет организациям автоматически размечать, аннотировать и организовывать как структурированные, так и неструктурированные документы, превращая их в надежные источники информации для различных приложений ИИ.
"Предприятия сталкиваются с проблемами при использовании готовых LLM, обученных на общедоступных данных из интернета," - отметил Алекс Ратнер, сооснователь и CEO Snorkel AI, в интервью. "Эти модели не предназначены для удовлетворения специфических потребностей организаций. Snorkel Flow решает эту проблему, обеспечивая эффективную разметку данных и развитие."
Например, если компания хочет создать чат-бота для сотрудников, который предоставляет информацию о внутренних политиках, Snorkel Flow может гарантировать правильную разметку соответствующих документов для легкого поиска. Аналогично, компании, разрабатывающие чат-ботов для обслуживания клиентов, могут тонко настроить модель для распознавания конкретных названий продуктов.
Ратнер объяснил, что Snorkel AI специализируется на "разработке данных для ИИ", которая включает разметку, кураторство данных и улучшение наборов данных. "Хотя облачные провайдеры предлагают API для настройки моделей, они не поддерживают подготовку данных для этих API, что часто является самой сложной задачей," — добавил он.
При запуске Snorkel Flow включала функции программной разметки данных и совместной разработки ИИ, которые продемонстрировали свою пользу для таких организаций, как Мемориальный онкологический центр Слоун Кеттеринга и Chubb. Эти организации сообщили о повышении точности и эффективности ИИ-моделей в 10 до 100 раз. Кроме того, Snorkel помог крупнейшим банкам автоматизировать разметку данных для соблюдения нормативных требований, сократив ручной труд с шести месяцев до всего 24 часов.
С увеличением распространенности базовых LLM, включая мощные модели с открытым исходным кодом, такие как Llama 3, скорость и точность разметки данных и кураторства стали жизненно важными для тонкой настройки ИИ-моделей, согласно Ратнеру.
Новые функции в Snorkel Flow
Обновленная платформа Snorkel Flow позволяет пользователям использовать свои корпоративные данные, теперь организованные и размеченные ИИ Snorkel, как надежный источник информации, совместимый с Google Gemini и Llama 3. Новые интеграции с Databricks Unity Catalog, Vertex AI и Microsoft Azure Machine Learning дополнительно улучшают организацию данных и управление доступом для предприятий.
Более того, Snorkel Flow теперь поддерживает программную разметку мультимодальных данных, включая изображения, что обеспечивает комплексный подход к аналитике ИИ. В частности, Wayfair уже получил пользу от возможностей разметки изображений, стремясь сократить время разметки с месяцев до дней.
Улучшенные функции безопасности
Snorkel внедрила управление доступом на основе ролей (RBAC) для администраторов аккаунтов, что позволяет детализированно контролировать доступ к данным и их использование для ИИ-проектов. Администраторы теперь могут управлять тем, кто может загружать данные и получать доступ к связанным сервисам, аналогично новой функции Projects от OpenAI, но с добавленной гибкостью управления доступом для множества моделей от разных поставщиков.
Кроме того, Snorkel Flow поддерживает локальный и изолированный доступ к базовым моделям, что повышает соответствие требованиям и безопасность данных.
Это обновление соответствует недавно запущенному корпоративному акселератору ИИ Snorkel Custom, который помогает организациям на всех этапах оценки, настройки и оптимизации ИИ-моделей.
От Демо до Практической Ценности
В общем, Snorkel стремится дать предприятиям возможность эффективно использовать генеративный ИИ, оптимизируя их данные для тонкой настройки моделей и разработки приложений, основанных на ИИ. "Существует огромное давление перейти от визуально привлекательных демонстраций ИИ к реальной производственной ценности," — отметил Ратнер.
Обе платформы, Snorkel Flow и Snorkel Custom, теперь доступны для общего пользования, с ценообразованием, основанным на конкретных сценариях использования.