AI已经彻底改变了企业运营和数据管理的方式。几年前,团队需要编写SQL查询和代码,从庞大的数据集中提取有意义的见解。如今,他们只需输入一个问题,先进的语言模型系统就能处理其余工作,使数据交互更加快速和直观。
尽管这些新查询系统充满潜力,但仍面临挑战。目前的模型在处理多样化查询时依然存在困难。因此,加州大学伯克利分校和斯坦福大学的研究人员开发了一种名为“表增强生成”(TAG)的新解决方案。
什么是表增强生成(TAG)?
TAG是一种统一的方法,旨在提升语言模型(LM)与数据库之间的交互,为利用LM的世界知识和推理能力提供了一种新范式。研究结果显示,TAG能够实现对自定义数据源的更复杂自然语言查询。
TAG的工作原理如何?
用户提问时,通常采用两种主要方法:文本转SQL和检索增强生成(RAG)。虽然这两种方法在一定程度上有效,但在处理复杂查询时常常力不从心。文本转SQL将自然语言翻译为SQL查询,但只能应对有限的关系代数问题。而RAG则侧重于在少量数据库记录中进行点查找以获取直接答案。
这两种方法经常无法应对需要语义推理或超出数据本身的知识问题。研究人员指出,现实中的查询通常涉及领域专业知识、世界知识和精准计算的复杂组合,而传统数据库系统在这些领域虽然擅长,但仍显不足。
为填补这一空白,TAG采用了三步模型进行对话式查询:
1. 查询生成:LM识别相关数据并将输入转换为可执行的数据库查询。
2. 查询执行:数据库引擎对庞大的数据存储执行查询,并提取最相关的信息。
3. 答案生成:最后,LM根据执行查询的结果生成自然语言回复。
这一创新框架集成了语言模型的推理能力与强大的数据库查询执行,能够处理复杂问题,这些问题往往需要深入的语义推理、世界知识和领域专业知识。
TAG的性能提升
为了评估TAG的有效性,研究人员使用了BIRD数据集,该数据集旨在测试文本转SQL的能力,并进行了调整以包含需要语义推理的问题。他们将TAG与多项基准测试进行了比较,包括文本转SQL和RAG。
结果显示,所有基线方法的准确率均不超过20%,而TAG的准确率则达到了40%以上。手工编写的TAG模型总共正确回答了55%的查询,其中准确匹配的成功率为65%。在各种查询类型中,TAG表现出超过50%的准确率,尤其在复杂比较中表现优异。
此外,TAG的查询执行速度是其他基线的三倍,展示了企业有望将AI与数据库能力结合在一起,从中提取有价值的见解,而无需进行大量编码工作。
尽管TAG显示出良好的结果,但仍需进一步精细化。研究团队建议对高效的TAG系统设计进行更多探索。为支持持续的实验,已将修改后的TAG基准发布在GitHub上。
总之,TAG在AI驱动的查询领域带来了显著进步,为企业提升数据提取过程和决策能力开辟了新路径。