Улучшение корпоративных баз данных: как Open-Source SuperDuperDB интегрирует ИИ для повышения производительности

Компания SuperDuperDB из Сан-Франциско, входящая в портфель Intel Ignite, запустила версию 0.1 своего открытого фреймворка, который упрощает разработку и внедрение AI-приложений. Этот пакет на Python позволяет пользователям беспрепятственно интегрировать AI — от моделей машинного обучения до предпочитаемых API — и использовать возможности векторного поиска в уже существующих базах данных, что позволяет строить AI-приложения непосредственно на этих платформах.

С поддержкой 1,75 миллионов долларов раннего финансирования от таких инвесторов, как Hetz.vc и Session.vc, а также венчурного капитала MongoDB, SuperDuperDB демонстрирует значительный потенциал в области AI. «Поддержка MongoDB подтверждает трансформационный потенциал SuperDuperDB. Мы стремимся устранить разрыв между хранением данных и AI, облегчая организациям создание и управление AI-приложениями, развивая симбиотические отношения между данными и AI», — сказал Тимо Хагенов, генеральный директор SuperDuperDB.

Фреймворк уже доступен на Product Hunt.

Решение проблемы AI с SuperDuperDB

С увеличением роли AI в современных бизнес-процессах разработка приложений, использующих мощные модели ML и собственные данные, становится все более сложной. Несмотря на наличие множества ML-моделей и API, разработчики часто сталкиваются с серьезными препятствиями при внедрении этих технологий в производство. Интеграция данных из основных баз данных в специализированные векторные базы обычно требует сложных и хрупких конвейеров, что приводит к длительным процессам, задерживающим запуск проектов.

«Компании часто сосредотачиваются только на упрощении развертывания алгоритмов на вычислительных ресурсах или интеграции данных и алгоритмов через сложные конвейеры, известные как MLOps», — объяснил Хагенов.

Чтобы упростить этот процесс, Хагенов и его команда разработали SuperDuperDB — фреймворк, который приносит AI-модели, включая потоковое инференсирование и масштабируемое обучение моделей, непосредственно в базу данных предприятия. «SuperDuperDB можно легко установить как пакет Python, позволяя разработчикам настроить единую масштабируемую развертку всех своих AI-моделей и API для прямого общения с базой данных. Это преобразует базу данных в надежную среду для разработки и внедрения AI, которую можно использовать в экспериментах, на одном клиенте или масштабировать в облаке или на локальных серверах через Kubernetes. Это дает разработчикам полный контроль над алгоритмами, данными, вычислениями и инфраструктурой как с открытым исходным кодом», — добавил Хагенов.

С этим фреймворком разработчики могут использовать различные модели машинного обучения для задач, таких как классификация, регрессия и рекомендации, а также передовые генеративные модели AI для чатов на основе LLM и векторных поисков. Функция векторного поиска может использовать как встроенные в базу данных возможности от поставщиков, так и собственные векторные индексы SuperDuperDB.

Сильная партнерская экосистема

Несмотря на то, что продукт все еще находится на начальной стадии, SuperDuperDB привлек внимание ключевых игроков экосистемы, предоставляя командам предприятий широкую поддержку для популярных баз данных и моделей. Фреймворк поддерживает различные платформы данных, включая MongoDB, PostgreSQL, MySQL, SQLite и Snowflake. В области AI он совместим с моделями из экосистемы Python, PyTorch, Sklearn и популярными API от таких компаний, как OpenAI и Anthropic.

«MongoDB стал нашим официальным технологическим партнером, и мы провели вебинары и живое программирование с крупными клиентами, такими как Cisco. Мы также исследуем несколько POCs с Intel и другими малыми и средними предприятиями», — сказал Хагенов.

Расширение экосистемы

Хагенов акцентировал внимание на том, что SuperDuperDB активно стремится улучшить свою экосистему через сотрудничество с крупными компаниями по производству баз данных для более глубоких интеграций. Конечная цель — добиться бесшовной интеграции с корпоративными платформами данных, такими как Databricks и Snowflake. В частности, компания планирует создать нативное приложение для Snowflake, которое будет доступно в его маркетплейсе.

Потенциальные применения

Если SuperDuperDB будет широко внедрен, он может упростить разработку AI-приложений в различных отраслях. «Сочетание технологий SuperDuperDB с MongoDB Atlas Vector Search значительно ускоряет путь разработчика AI. Это новшество позволяет отраслям — от обнаружения мошенничества в финансах до открытия лекарств в здравоохранении — быстро создавать и внедрять современные приложения», — отметил Борис Бялек, технический директор по отраслевым решениям в MongoDB.

Хотя уже существуют решения AI на базе данных, такие как MindsDB, они обычно требуют от разработчиков адаптации к диалектам SQL. В отличие от них, SuperDuperDB ориентирован на Python, что соответствует языку программирования, преобладающему в исследовании и разработке AI. «SuperDuperDB предлагает знакомый интерфейс Python при этом позволяя экспертам обращаться к детальным элементам реализации, таким как веса моделей и спецификации обучения. Он позволяет пользователям работать с различными типами данных, включая изображения, видео и аудио, закодированные как байты в Python. Этот уникальный подход отличает SuperDuperDB в сфере открытого исходного кода AI», — заключил он.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles