SingleStore Улучшает Базу Данных для Генеративных ИИ Нагрузок
Сегодня SingleStore представляет новое обновление, которое значительно повышает возможности своей платформы базы данных для генерирующих ИИ, транзакционных и аналитических задач. Обновленная база данных SingleStore Pro Max, также известная как SingleStore 8.5, включает продвинутую индексацию векторного поиска, что позволяет организациям эффективно создавать и поддерживать приложения генеративного ИИ и сценарии с использованием увеличенного извлечения (RAG).
Исторический Контекст Векторных Возможностей
Новое улучшение индексации векторного поиска не является первым введением векторных возможностей в базе данных SingleStore. Эта технология присутствует в их предложениях с 2017 года, когда компания была известна как MemSQL. После ребрендинга в 2020 году SingleStore объединила онлайн-аналитическую обработку (OLAP) и онлайн-транзакционную обработку (OLTP) в единую платформу базы данных.
С ростом нагрузки генеративного ИИ возросла и потребность в векторных функциях базы данных. Появились нативные платформы, такие как Pinecone, и крупные поставщики баз данных, включая DataStax, Neo4j, MongoDB, PostgreSQL и Oracle начали внедрять векторные возможности. Генеральный директор SingleStore, Радж Верма, отметил, что предложение только специализированной векторной базы данных недостаточно для организаций, подчеркивая важность интеграции существующих функций базы данных.
Верма заявил: «Мы предоставляем стек генеративного ИИ, который включает векторы, позволяя создавать и моделировать приложения генеративного ИИ. Векторная база данных — это просто функция, а не долгосрочное решение, так как она вводит ненужную сложность в ваш ИИ-стек».
Гибридный Поиск По Разнообразным Типам Данных
SingleStore выполняет двойную функцию как гибридная база данных для транзакционной и аналитической обработки (HTAP), способная хранить, обрабатывать и запрашивать различные типы данных. Релиз Pro Max улучшает возможности векторного поиска для как структурированных, так и неструктурированных данных. Хотя SingleStore поддерживает векторный поиск с 2017 года, последняя версия включает передовые алгоритмы, такие как Продуктовая Квантизация (PQ), Иерархическое Навигационное Малое Мировое Пространство (HNSW) и Индексирование Приблизительных Ближайших Соседей (ANN) для более быстрого и точного поиска.
Улучшенные возможности векторного поиска обеспечивают организациям возможность эффективно использовать все данные, хранящиеся в SingleStore, для успешных поисков и разработки приложений генеративного ИИ. Верма подчеркнул, что хотя базы данных с фокусом на векторы могут облегчить вход в генеративный ИИ, они часто не учитывают сложности более широкой структуры данных организации.
«Просто добавление векторов не скроет сложностей состояния данных организации», — заявил он.
Верма также разъяснил видение SingleStore о служении в качестве комплексной векторной базы данных в упрощенной экосистеме данных, охватывающей все необходимые типы данных. «Только через упрощение и консолидацию данных организации могут достичь необходимой скорости и эффективности для успешной работы в области генеративного ИИ», — добавил он.
Улучшенный Захват Изменений Данных с Apache Iceberg
В современных условиях организациям редко удается централизовать все свои данные в одной базе данных. Обычно конвейеры данных охватывают несколько репозиториев и приложений. Распространенный метод извлечения данных из внешних источников в рамках базы данных — это Захват Изменений Данных (CDC).
SingleStore Pro Max предлагает улучшенные функции CDC, позволяющие пользователям интегрировать данные из MySQL, MongoDB и озер данных на основе Apache Iceberg в одну централизованную базу данных. Поддержка Apache Iceberg, открытого формата таблиц озера данных, популярного среди ведущих поставщиков, таких как IBM и Snowflake, имеет особое значение. Верма отметил, что SingleStore продолжает сотрудничество с IBM и Snowflake, добавив, что поддержка Iceberg значительно упростит задачи интеграции.
«Возможность CDC позволяет нашим клиентам аггрегировать данные из различных источников в SingleStore, что имеет решающее значение для всего рабочего процесса увеличенного извлечения», — сказал Верма.