Google Cloud integra tecnologia de busca e YouTube em aplicações de IA generativa para empresas.

À medida que a IA generativa avança, as empresas percebem que chatbots básicos já não são suficientes. Os hyperscalers de nuvem estão rapidamente aprimorando seus bancos de dados e ferramentas para possibilitar uma implantação rápida e eficiente de dados operacionais, capacitando os negócios a criar aplicações inteligentes e contextualmente conscientes.

Um exemplo notável são as atualizações recentes do Google Cloud em suas ofertas de banco de dados, começando pelo AlloyDB. Em um post no blog, o Google anunciou que seu banco de dados totalmente gerenciado, compatível com PostgreSQL, agora apresenta a disponibilidade geral do índice vetorial ScaNN (scalable nearest neighbor). Essa tecnologia, que sustenta o Google Search e o YouTube, facilita a criação de índices e consultas vetoriais mais rápidas, reduzindo significativamente o consumo de memória.

Além disso, o Google firmou parceria com a Aiven para oferecer implantação gerenciada do AlloyDB e introduziu atualizações para o Memorystore for Valkey e o Firebase.

Compreendendo o Valor do ScaNN para o AlloyDB

Os bancos de dados vetoriais são essenciais para alimentar cargas de trabalho avançadas de IA, desde chatbots RAG até sistemas de recomendação. Eles se destacam no armazenamento e gerenciamento de embeddings vetoriais (representações numéricas de dados) e na realização de buscas de similaridade, fundamentais para aplicações específicas.

Com o PostgreSQL sendo o banco de dados preferido entre desenvolvedores em todo o mundo, sua extensão de busca vetorial, pgvector, ganhou imensa popularidade. O Google Cloud suporta esse recurso no AlloyDB, utilizando um algoritmo gráfico de ponta chamado Hierarchical Navigable Small World (HNSW) para operações vetoriais. No entanto, a performance do HNSW pode declinar com cargas de trabalho vetoriais extremamente grandes, resultando em latências na aplicação e aumento no uso de memória.

Para superar esses desafios, o Google Cloud disponibilizou o índice vetorial ScaNN no AlloyDB. Esse índice inovador utiliza a mesma tecnologia do Google Search e YouTube, proporcionando consultas vetoriais até quatro vezes mais rápidas e criação de índices até oito vezes mais ágil, consumindo de 3 a 4 vezes menos memória do que o índice padrão HNSW em PostgreSQL.

“O índice ScaNN é o primeiro índice compatível com PostgreSQL que pode escalar para suportar mais de um bilhão de vetores, oferecendo desempenho excepcional em consultas—possibilitando cargas de trabalho de alta performance para qualquer empresa”, afirmou Andi Gutmans, GM e VP de Engenharia para Banco de Dados no Google Cloud.

Gutmans também anunciou que o AlloyDB Omni, a versão baixável do AlloyDB, estará disponível como um serviço gerenciado por meio de uma parceria com a Aiven, permitindo implantação em qualquer ambiente, incluindo local ou na nuvem. “Execute cargas de trabalho transacionais, analíticas e vetoriais em nuvens em uma única plataforma, construindo facilmente aplicações de IA generativa onde for necessário”, continuou.

Aprimoramentos para Memorystore for Valkey e Firebase

Além disso, o Google Cloud introduziu melhorias para o Memorystore for Valkey, seu cluster gerenciado para o banco de dados em memória Valkey, e para a plataforma de desenvolvimento de aplicativos Firebase. O Valkey agora incluirá capacidades de busca vetorial, permitindo que uma única instância realize buscas de similaridade com latência de dígitos únicos em milissegundos em mais de um bilhão de vetores, alcançando mais de 99% de recall. A próxima versão, Memorystore for Valkey 8.0, está atualmente em prévia pública, apresentando consultas 2x mais rápidas em comparação ao Memorystore para Redis Cluster, além de novos esquemas de replicação, melhorias de rede e maior visibilidade de desempenho.

Para o Firebase, o Google Cloud deve revelar o Data Connect, um backend-como-um-serviço integrado a um banco de dados PostgreSQL totalmente gerenciado, alimentado pelo Cloud SQL, que entrará em prévia pública ainda este ano.

Com essas inovações, o Google Cloud pretende fornecer aos desenvolvedores um conjunto abrangente de opções de infraestrutura e banco de dados, aliado a robustos modelos de linguagem, para criar aplicações inteligentes para suas organizações. Com a demanda por aplicações de IA generativa prevista para crescer drasticamente, a Omdia estima que o mercado se expandirá de $6,2 bilhões em 2023 para $58,5 bilhões em 2028, representando um CAGR de 56%.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles