구글은 개발자와 조직이 생성 AI의 기능을 활용할 수 있도록 데이터베이스와 분석 플랫폼을 강화하고 있습니다. 2024년에는 Gemini 대규모 언어 모델(LLM)에 여러 업데이트를 도입하여 유용성을 확대했습니다. 최근 구글은 BigQuery 분석 서비스에 Gemini 모델을 통합하고 AI 데이터 준비 및 검색 증강 생성(RAG)을 위한 새로운 기능을 발표했습니다. 또한, 구글은 모든 클라우드 데이터베이스에서 벡터 검색 지원을 도입하여 AI 데이터베이스 기능을 크게 확장하고 있습니다.
“우리는 벡터 인덱싱과 벡터 검색이 모든 데이터베이스의 기본이 되어야 한다고 믿습니다.”라고 구글 클라우드 데이터베이스 부문 GM이자 VP인 앤디 구트먼스가 말했습니다. “데이터베이스는 효과적인 검색 증강 생성을 위해 중요한 역할을 하며, 기업 내 AI의 이점을 극대화합니다.”
모든 구글 데이터베이스에서 벡터 검색 가능
구글은 이전에 일부 데이터베이스에서 벡터 지원을 제공했지만 이제는 모든 제품에 이 기능을 확장하고 있습니다. 이미 벡터 및 AI 기능을 선보인 Google AlloyDB 데이터베이스가 일반 출시되었으며, 구글의 Vertex AI 벡터 검색 서비스도 이러한 발전을 보완합니다. 새로운 기능에는 Redis를 위한 인메모리 Memorystore, CloudSQL, Spanner 관계형 데이터베이스, Firestore 문서 데이터베이스 및 Bigtable 키-값 데이터베이스에서의 벡터 미리보기 지원이 포함됩니다.
모든 구글 데이터베이스에 벡터 검색을 통합하는 데는 상당한 엔지니어링 노력이 필요합니다. 구트먼스는 오픈 소스 PostgreSQL 프레임워크에 기반한 AlloyDB의 경우, 구글이 오픈 소스 pgvector 기술을 활용하여 벡터 지원을 구현했지만, 사용자 경험을 최적화하기 위해 광범위한 작업을 수행했다고 강조했습니다.
“각 데이터베이스의 특정 아키텍처 특성에 맞춰 다양한 작업 흐름에서 혁신해야 합니다.”라고 구트먼스가 말했습니다. 벡터 검색을 통해 쿼리를 처리하기 위해 데이터베이스는 일반적으로 추가 인덱싱이 필요합니다. 구글의 강점은 대규모 주요 서비스에서의 경험을 바탕으로 벡터 지원 인덱스를 구축하는 데 있다고 그는 강조했습니다.
“이러한 규모에서 운영하면서 우리는 내부 광고 및 검색 부문에서 10년 이상 벡터 기능을 활용해왔기 때문에 벡터 기능에 대한 깊은 이해를 가지고 있습니다.”라고 설명했습니다.
BigQuery, Gemini Pro 모델로 강화
구글은 분석 부문에서 BigQuery를 최신 Gemini Pro 모델 지원으로 강화하고 있습니다. 구글 클라우드 데이터 분석 부문 GM이자 VP인 게리트 카스마이어는 최근 기자회견에서 “새로운 분석 시나리오를 열어줍니다”라고 밝혔습니다.
이러한 고급 기능은 구조화된 데이터와 비구조화된 데이터 모두에 대해 개선된 요약, 감정 추출, 분류, 보강 및 번역을 포함합니다. 카스마이어는 기업 데이터의 많은 부분이 특히 비구조화된 데이터는 여전히 활용되지 않고 있다고 강조했습니다. “Gemini Pro와 BigQuery를 통해 사용자는 이제 구조화된 데이터와 함께 풍부한 비구조화된 데이터를 원활하게 분석할 수 있습니다.”라고 덧붙였습니다.