ApertureData обеспечивает десятикратное увеличение скорости для предприятий, использующих мультимодальные данные.

Данные являются основой инноваций в области ИИ. Организации — от гибких стартапов до многонациональных корпораций — инвестируют миллиарды, чтобы использовать наборы данных для высокоэффективных приложений ИИ.

Тем не менее, несмотря на значительные инвестиции, доступ и использование данных из разнообразных источников и модальностей — таких как текст, видео и аудио — остаются сложными задачами. Команды сталкиваются с различными проблемами интеграции, что приводит к задержкам и потерям бизнес-возможностей.

Стартап ApertureData из Калифорнии стремится решить эту проблему с помощью единого уровня данных, ApertureDB. Это инновационное решение объединяет преимущества графовых и векторных баз данных, а также управление мультимодальными данными, позволяя командам ИИ и данных ускорить развертывание своих приложений. Недавно ApertureData объявила о привлечении 8,25 миллиона долларов в виде стартового финансирования и запуске облачной версии своей графово-векторной базы данных.

«ApertureDB может сократить время на создание инфраструктуры данных и подготовку наборов данных на 6–12 месяцев, что приносит огромную ценность CTO и CDO, которым необходимо разрабатывать эффективные стратегии ИИ в быстро меняющейся среде с противоречивыми требованиями к данным», — прокомментировала Вишакха Гупта, основатель и CEO ApertureData. Она подчеркнула, что это предложение может повысить продуктивность команд по дата-科学 и машинному обучению в среднем в десять раз в процессе разработки мультимодального ИИ.

Что выделяет ApertureData на фоне других?

Многие организации сталкиваются с проблемами управления постоянно растущим потоком мультимодальных данных — терабайты текстов, изображений, аудио и видео — что затрудняет эффективное использование ИИ. Проблема заключается не в нехватке данных, а в фрагментированной экосистеме инструментов, необходимых для их обработки для продвинутых ИИ-приложений.

На данный момент командам необходимо собирать данные из различных источников, хранить их в облачных репозиториях и иметь дело с постоянно меняющейся метаданными в файлах или базах данных. Этот процесс часто требует написания пользовательских скриптов для извлечения и предварительной обработки данных. После выполнения начальных задач командам необходимо интегрировать графовые базы данных и функциональность векторного поиска, что приводит к значительным задержкам.

«Корпорации ожидают, что их уровень данных будет способствовать управлению различными модальностями данных, упрощать подготовку машинного обучения и поддерживать управление наборами данных, аннотациями, отслеживанием моделей и продвинутым поиском и визуализацией данных. К сожалению, они часто прибегают к вручную интегрированным решениям, использующим различные облачные системы хранения, базы данных и библиотеки обработки, что усложняет рабочий процесс и задерживает сроки проектов», — объяснила Гупта, которая узнала об этой проблеме, работая с визуальными данными в Intel.

Для решения этой задачи Гупта объединилась с Луисом Ремисом, исследовательским ученым в Intel Labs, чтобы создать комплексный уровень данных, который охватывает все задачи мультимодальных данных ИИ на одной платформе.

Теперь ApertureDB позволяет предприятиям централизовать наборы данных — большие изображения, видео, документы, векторные представления и их метаданные — для эффективного извлечения и запроса. Он предоставляет единый взгляд на схему и включает в себя функции графа знаний и векторного поиска для различных приложений ИИ, от чат-ботов до поисковых систем.

«Во время обширных переговоров мы поняли, что существует необходимость в базе данных, которая всесторонне понимает как управление мультимодальными данными, так и требования к ИИ, что делает принятие и развертывание в производственной среде легким. Именно этого мы достигли с ApertureDB», — отметила Гупта.

Как ApertureDB соотносится с существующими решениями?

Хотя на рынке доступны множество баз данных, ориентированных на ИИ, ApertureData стремится занять свою нишу, предлагая единый продукт, который нативно обрабатывает мультимодальные данные и бесшовно интегрирует графы знаний с быстрым векторным поиском для приложений ИИ. Пользователи могут легко исследовать отношения между наборами данных и использовать предпочитаемые фреймворки ИИ для конкретных приложений.

«Нашими основными конкурентами являются внутренние платформы данных, которые полагаются на смешанные инструменты, такие как реляционные или графовые базы данных, облачное хранилище и собственные скрипты. Обычно мы заменяем такие решения, как Postgres, Weaviate, Qdrant, Milvus, Pinecone, MongoDB или Neo4j, особенно в контексте мультимодального и генеративного ИИ», — подчеркнула Гупта.

ApertureData утверждает, что их база данных может увеличить производительность команд по науке о данных и ИИ в среднем в 10 раз. Она, как сообщается, мобилизует мультимодальные наборы данных до 35 раз быстрее, чем традиционные решения, и обеспечивает производительность векторного поиска и классификации на 2–4 раза быстрее, чем существующие открытые векторные базы данных.

Хотя Гупта воздержалась от раскрытия конкретных имен клиентов, она отметила, что у них есть развертывания с отдельными компаниями из списка Fortune 100, включая крупный розничный продавец товаров для дома, крупного производителя и различные стартапы в области биотехнологий и генеративного ИИ.

«Во всех наших развертываниях отзывы клиентов подчеркивают значительные улучшения в продуктивности, масштабируемости и производительности», — добавила она, отметив, что компания сэкономила одному из клиентов 2 миллиона долларов.

В будущем ApertureData планирует расширить свою облачную платформу для поддержки новых классов приложений ИИ, улучшить интеграцию экосистемы для более бесшовного пользовательского опыта и расширить партнерства для более широких развертываний.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles