La inteligencia artificial ha revolucionado la forma en que las empresas operan y gestionan datos. Hace unos años, los equipos necesitaban escribir consultas SQL y código para obtener información valiosa de grandes conjuntos de datos. Hoy en día, pueden simplemente formular una pregunta y permitir que sistemas avanzados de modelos de lenguaje se encarguen del resto, lo que facilita interacciones rápidas e intuitivas con sus datos.
A pesar de las promesas de estos nuevos sistemas de consulta, persisten desafíos. Los modelos actuales tienen dificultades para abordar una amplia gama de consultas, lo que llevó a investigadores de UC Berkeley y Stanford a desarrollar una nueva solución llamada generación aumentada de tablas (TAG).
¿Qué es la Generación Aumentada de Tablas?
TAG es un enfoque unificado que mejora las interacciones entre modelos de lenguaje (LMs) y bases de datos, ofreciendo un nuevo paradigma para aprovechar los conocimientos y habilidades de razonamiento de los LMs. Según los hallazgos de los investigadores, TAG permite realizar consultas en lenguaje natural más sofisticadas sobre fuentes de datos personalizadas.
¿Cómo Funciona TAG?
Cuando los usuarios formulan preguntas, se emplean comúnmente dos métodos principales: text-to-SQL y generación aumentada por recuperación (RAG). Aunque son efectivos en cierta medida, ambos métodos fallan con consultas complejas que desafían sus capacidades. El text-to-SQL traduce el lenguaje natural en consultas SQL, pero solo abarca un conjunto limitado de preguntas de álgebra relacional. Por su parte, RAG se centra en búsquedas puntuales para respuestas directas en unos pocos registros de la base de datos.
Ambos métodos a menudo enfrentan dificultades con preguntas que requieren razonamiento semántico o conocimiento más allá de los datos mismos. Como señalaron los investigadores, las consultas del mundo real a menudo implican combinaciones complejas de experiencia en el dominio, conocimiento general y cálculo exacto, áreas donde los sistemas tradicionales de bases de datos destacan, pero son insuficientes por sí solos.
Para cerrar esta brecha, el enfoque TAG emplea un modelo de tres pasos para consultas conversacionales:
1. Síntesis de Consulta: El LM identifica datos relevantes y convierte la entrada en una consulta ejecutable para la base de datos.
2. Ejecución de Consulta: El motor de la base de datos ejecuta la consulta contra vastos repositorios de datos y recupera la información más pertinente.
3. Generación de Respuesta: Finalmente, el LM genera una respuesta en lenguaje natural basada en los resultados de la consulta ejecutada.
Este marco innovador permite integrar las capacidades de razonamiento de los modelos de lenguaje con una sólida ejecución de consultas en bases de datos, facilitando el manejo de preguntas complejas que requieren un razonamiento semántico profundo, conocimiento general y experiencia en el dominio.
Mejoras de Rendimiento con TAG
Para evaluar la efectividad de TAG, los investigadores utilizaron BIRD, un conjunto de datos diseñado para probar capacidades de text-to-SQL, y lo adaptaron para incorporar preguntas que requieren razonamiento semántico. Evaluaron TAG frente a varios estándares, incluidos text-to-SQL y RAG.
Los resultados mostraron que, mientras todos los métodos de referencia alcanzaron niveles de precisión de no más del 20%, TAG superó con una tasa de precisión del 40% o más. El modelo TAG escrito a mano respondió correctamente al 55% de las consultas en general, con una tasa de éxito del 65% en comparaciones de coincidencias exactas. En diversos tipos de consultas, TAG demostró un rendimiento constante de más del 50% de precisión, destacándose particularmente en comparaciones complejas.
Además, las implementaciones de TAG lograron velocidades de ejecución de consultas tres veces más rápidas que las de otros métodos de referencia, demostrando el potencial de las empresas para unificar la inteligencia artificial con capacidades de base de datos para extraer información valiosa sin requerir amplios esfuerzos de codificación.
Si bien TAG muestra resultados prometedores, se necesita una mayor refinación. El equipo de investigación sugiere explorar adicionalmente un diseño eficiente del sistema TAG. Para apoyar la experimentación continua, se ha puesto a disposición el estándar TAG modificado en GitHub.
En conclusión, TAG representa un avance significativo en el ámbito de las consultas impulsadas por inteligencia artificial, allanando el camino para que las empresas mejoren sus procesos de extracción de datos y capacidades de toma de decisiones.