Хотя векторные базы данных становятся необходимыми для внедрения ИИ в бизнесе с использованием генерации, дополненной запросами (RAG), настоящей проблемой остается эффективное управление неструктурированными данными.
Кристиан Латимер, соучредитель и CEO Vectorize, ранее возглавлял облачные инициативы в DataStax. Он заметил распространенную проблему: векторная база данных не была главным препятствием при внедрении RAG в корпоративной среде. Сложности возникали при оптимизации процесса загрузки неструктурированных данных в векторную базу, чтобы использовать их для генеративного ИИ.
В ответ на эту проблему Латимер запустил Vectorize десять месяцев назад. Компания недавно объявила о раунде начального финансирования в размере 3,6 миллиона долларов, возглавляемом True Ventures, и о доступности своей платформы RAG для бизнеса. Эта платформа предлагает агентный подход RAG, обеспечивая возможность работы с данными почти в реальном времени. Vectorize концентрируется на инженерии данных, помогая организациям подготавливать и управлять своими данными для векторных баз данных и крупных языковых моделей (LLMs). Кроме того, она позволяет предприятиям быстро создавать конвейеры данных RAG через интуитивно понятный интерфейс и включает инструмент оценки RAG для тестирования различных стратегий.
«Мы постоянно обнаруживали, что на заключительных этапах проектов по генеративному ИИ результаты часто были неудовлетворительными», — отметил Латимер в эксклюзивном интервью. «Контекст, предоставленный векторной базе данных, не был полезен для крупной языковой модели, что вело к галлюцинациям и искажениям данных».
Как Vectorize интегрируется в стек RAG для бизнеса
Vectorize не является векторной базой данных; это платформа, соединяющая источники неструктурированных данных с существующими векторными базами данных, такими как Pinecone, DataStax, Couchbase и Elastic. Она загружает и оптимизирует данные из различных источников, обеспечивая готовый к производству конвейер, охватывающий загрузку, синхронизацию, обработку ошибок и лучшие практики в инженерии данных.
Кроме того, Vectorize не является технологией векторизации. Вместо этого платформа помогает пользователям оценивать различные модели встраивания и методы деления данных, чтобы найти оптимальное решение для своих конкретных случаев. Латимер подчеркнул гибкость платформы, позволяя пользователям выбирать из множества моделей встраивания, включая встраивания Ada от OpenAI и Voyage AI, используемые Snowflake.
«Мы сосредоточены на инновационных стратегиях векторизации данных для достижения наилучших результатов», — сказал Латимер, подчеркивая, что платформа предоставляет готовое к производству решение, снимая тревоги по поводу инженерии данных.
Использование агентного ИИ для RAG в бизнесе
Одной из выдающихся функций Vectorize является подход "агентный RAG", который сочетает традиционные методы RAG с возможностями ИИ-агентов, способствуя автономному решению задач. Groq, ранний адоптер и стартап в области ИИ-инфраструктуры, который недавно привлек 640 миллионов долларов, использует возможности агентного RAG Vectorize для улучшения ИИ-агента поддержки. Этот агент может автономно отвечать на запросы клиентов, используя данные и контекст из конвейеров Vectorize.
Латимер объяснил: «Если клиент задает повторяющийся вопрос, агент должен эффективно решить его проблему без вмешательства человека. Однако, если он сталкивается с более сложной задачей, он должен передать ее на уровень человека для помощи, что и есть суть архитектуры ИИ-агента».
Важно иметь конвейеры данных в реальном времени для RAG в бизнесе
Для предприятий значительное преимущество использования RAG заключается в доступе к актуальным данным. «Старые данные приводят к плохим решениям», — предостерег Латимер. Vectorize предлагает возможности обновления данных в реальном времени и почти в реальном времени, позволяя клиентам настраивать предпочтения в свежести данных.
«Мы даем пользователям возможность настраивать платформу в соответствии с их допустимыми уровнями устаревания данных», — сказал он. «Если они требуют еженедельных обновлений или обновления в реальном времени, наша платформа может удовлетворить эти потребности, предоставляя актуальные данные по мере их появления».