El mercado de bases de datos vectoriales prosperó en 2023, impulsado por la necesidad de contexto y memoria a largo plazo en modelos de lenguaje grandes, que a su vez mejoran la eficiencia y precisión de las técnicas de generación aumentada por recuperación (RAG). Este avance busca mitigar las alucinaciones de la IA. Liderando este panorama competitivo está la startup Pinecone, con sede en Nueva York, que aseguró $100 millones en financiamiento el pasado abril.
Pinecone ha presentado recientemente su arquitectura de base de datos vectorial sin servidor, que describe como ‘revolucionaria’. Esta solución innovadora permite a las empresas desarrollar aplicaciones de IA más perspicaces y rentables. Según un comunicado de prensa, el modelo sin servidor de Pinecone promete reducciones de costos de hasta el 50%, eliminando las complejidades de infraestructura y permitiendo a los negocios lanzar aplicaciones generativas de IA de mayor calidad más rápidamente.
La empresa destacó varias innovaciones clave, que incluyen:
- Separación de lecturas, escrituras y almacenamiento para reducir costos operativos.
- Arquitectura pionera en la industria que presenta agrupaciones de vectores en almacenamiento de blobs, facilitando búsquedas de vectores de baja latencia y costo en vastos conjuntos de datos.
- Algoritmos de indexación y recuperación personalizados.
- Una capa de computación multiusuario que soporta recuperación bajo demanda para miles de usuarios.
El CEO de Pinecone, Edo Liberty, enfatizó la relevancia de esta nueva arquitectura sin servidor, afirmando: “No lo digo a la ligera. Hemos estado dedicados a este proyecto durante un año y medio; es nuestro empeño más ambicioso.” Reiteró que el objetivo va más allá de crear la mejor base de datos vectorial. “Nuestro propósito es habilitar una nueva generación de aplicaciones generativas de IA que antes eran imposibles,” explicó, mostrando confianza en el papel de Pinecone para abordar las alucinaciones de IA que han impedido a las empresas lanzar soluciones de IA generativa centradas en el cliente.
Empresas como Notion, Blackstone, Canva, Domo y Gong ya están utilizando la tecnología sin servidor de Pinecone. Liberty destacó que el nuevo producto cuenta con la infraestructura robusta necesaria para indexar miles de millones de vectores para miles, si no cientos de miles, de usuarios, asegurando una gestión de RAG escalable. “Pueden hacerlo más fácilmente y a un costo entre 10 y 100 veces menor que los sistemas anteriores,” añadió.
La introducción de la solución sin servidor de Pinecone refleja una maduración en el stack tecnológico de IA generativa. El lanzamiento incluye integraciones con otros líderes en el dominio de la IA, como Anthropic, Anyscale, Cohere, Confluent, Langchain, Pulumi y Vercel. Liberty comentó: “La colaboración entre estos actores clave significa que el stack tecnológico está evolucionando, permitiendo a los desarrolladores crear productos potentes que funcionan de manera conjunta.”