Традиционные табличные базы данных сталкиваются с трудностями в эпоху ИИ, особенно когда речь идет о сложных типах данных, таких как векторы, изображения, видео и аудио в больших объемах. Хранение таких разнообразных форматов является сложной задачей, а их извлечение и управление добавляют еще один уровень сложности, особенно при наличии нескольких типов файлов.
На помощь приходит LanceDB — решение, созданное для реалий ИИ. Поддерживаемая Y Combinator, компания недавно объявила о завершении посевного раунда на сумму 8 миллионов долларов в рамках общего финансирования в 11 миллионов долларов. LanceDB разрабатывает базу данных, которая специально предназначена для мультимодальных данных, используя открытую колонковую структуру Lance, оптимизированную для задач машинного обучения. Платформа предлагает интеграцию с объектным хранилищем на уровне, что обеспечивает высокую производительность, масштабируемость и облачное управление ИИ-данными.
Разработчики могут использовать LanceDB тремя способами: встраивать его в существующий бэкенд, запускать через клиентское приложение, такое как Jupyter Notebook, или развертывать его как удаленную безсерверную базу данных. В отличие от традиционных систем, где клиент и сервер функционируют как отдельные процессы, LanceDB эффективно разделяет хранилище и вычисления, что позволяет напрямую встраивать его в приложения.
Ряд известных организаций, таких как Midjourney, Character.ai, Airtable, Tubi, Hex и WeRide, уже используют LanceDB. С этим финансированием компания намерена улучшить свои предложения, облегчая переход ИИ-проектов от экспериментов к производству. Посевный раунд возглавила венчурная компания CRV при поддержке Y Combinator, Essence VC и Swift Ventures.
«Мультимодальные модели — это новая граница. Прогрессивные специалисты по ИИ нуждаются в инновационной инфраструктуре данных для обучения, обновления и соответствия следующему поколению приложений ИИ», — отметил Мурат Бичер, генеральный партнер CRV.
Коммерческие предложения LanceDB на данный момент включают полностью функциональную открытую базу данных с SDK для Rust, Python и JavaScript, размещенное безсерверное решение и продукт для предприятий, предназначенный для команд, работающих с большими наборами данных и нуждающихся в надежных средствах безопасности.