Google Cloud интегрирует технологии поиска и YouTube в корпоративные приложения с генеративным ИИ.

С развитием генеративного ИИ предприятия могут обнаружить, что базовые чат-боты уже не соответствуют их потребностям. Облачные гипермасштаберы стремительно улучшают свои базы данных и инструменты для быстрой и эффективной реализации оперативных данных, позволяя компаниям создавать интеллектуальные приложения с учётом контекста.

Ярким примером являются недавние обновления базы данных Google Cloud, начиная с AlloyDB. В одном из блогов Google объявил, что их полностью управляемая база данных, совместимая с PostgreSQL, теперь имеет общую доступность вектора ScaNN (масштабируемый ближайший сосед). Эта технология, лежащая в основе Google Search и YouTube, ускоряет создание индексов и векторные запросы, значительно уменьшая потребление памяти.

Кроме того, Google сотрудничает с Aiven для предоставления управляемого развертывания AlloyDB и анонсировал обновления для Memorystore для Valkey и Firebase.

Понимание ценности ScaNN для AlloyDB

Векторные базы данных необходимы для поддержки сложных задач ИИ, от RAG-чат-ботов до систем рекомендаций. Они отлично подходят для хранения и управления векторными вложениями и выполнения поиска по схожести, что критично для целевых приложений.

Так как PostgreSQL является предпочтительной базой данных для разработчиков по всему миру, его расширение для векторного поиска, pgvector, стало невероятно популярным. Google Cloud поддерживает эту функцию в AlloyDB, используя передовой графовый алгоритм под названием Hierarchical Navigable Small World (HNSW) для векторных операций. Однако производительность HNSW может снижаться при использовании очень больших векторных нагрузок, что приводит к задержкам в приложениях и увеличенному потреблению памяти.

Чтобы преодолеть эти вызовы, Google Cloud представил векторный индекс ScaNN в AlloyDB. Этот инновационный индекс использует ту же технологию, что и Google Search и YouTube, обеспечивая в четыре раза более быстрые векторные запросы и восьмикратное сокращение времени создания индексов, при этом потребляя в 3-4 раза меньше памяти, чем стандартный индекс HNSW в PostgreSQL.

"Индекс ScaNN — это первый индекс, совместимый с PostgreSQL, который может масштабироваться и поддерживать более одного миллиарда векторов, обеспечивая исключительную производительность запросов и позволяя высокопроизводительным рабочим нагрузкам для любой компании", — заявил Анди Гутманс, GM и VP по инженерным решениям в области баз данных Google Cloud.

Гутманс также сообщил, что AlloyDB Omni, загружаемая версия AlloyDB, будет доступна как управляемый сервис через партнерство с Aiven, что позволит развертывание в любой среде, включая локальные и облачные инфраструктуры. "Управляйте транзакционными, аналитическими и векторными рабочими нагрузками в различных облаках на одной платформе, легко создавая генеративные ИИ-приложения в любом месте."

Улучшения для Memorystore для Valkey и Firebase

Кроме этого, Google Cloud анонсировал обновления для Memorystore для Valkey, управляемого кластера для in-memory базы данных Valkey, и для платформы разработки приложений Firebase.

Valkey теперь будет включать функции векторного поиска, позволяя одной инстанции выполнять поиск по схожести с задержкой в миллисекунды на более чем миллиарде векторов, достигая более 99% точности. Следующая версия, Memorystore для Valkey 8.0, в настоящее время находится в публичном режиме предварительного просмотра, предлагая в два раза более быстрые запросы по сравнению с Memorystore для Redis Cluster, а также новые схемы репликации, улучшения сетевого взаимодействия и повышенную видимость производительности.

Для Firebase Google Cloud готовит запуск Data Connect, бэкенда как услуги, интегрированного с полностью управляемой базой данных PostgreSQL, основанной на Cloud SQL, которая будет в публичном предварительном просмотре позже в этом году.

С этими инновациями Google Cloud стремится предоставить разработчикам широкий набор инфраструктурных и базовых решений в сочетании с мощными языковыми моделями для создания интеллектуальных приложений для своих организаций. С учётом ожидаемого роста спроса на генеративные ИИ-приложения, Omdia прогнозирует, что рынок вырастет с 6,2 миллиардов долларов в 2023 году до 58,5 миллиардов долларов к 2028 году, что соответствует среднегодовому темпу роста (CAGR) 56%.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles