تحسين استعلامات مجموعات البيانات المعقدة: كيف تتفوق تقنية توليد الجداول المساعدة على تحويل النص إلى SQL

لقد غيرت الذكاء الاصطناعي طريقة عمل الشركات وإدارة البيانات. قبل بضع سنوات، كان يتعين على الفرق كتابة استعلامات SQL وكتابة التعليمات البرمجية لاستخراج رؤى قيمة من مجموعات البيانات الكبيرة. اليوم، يمكنهم ببساطة كتابة سؤال وترك أنظمة نماذج اللغة المتقدمة تتولى الباقي، مما يتيح تفاعلات سريعة وبديهية مع بياناتهم.

على الرغم من وعد هذه الأنظمة الجديدة للاستعلام، تظل هناك تحديات قائمة. تواجه النماذج الحالية صعوبات في معالجة نطاق واسع من الاستفسارات، مما دفع الباحثين من جامعة كاليفورنيا في بيركلي وستانفورد إلى تطوير حل جديد يسمى "التوليد المعزز بالجدول" (TAG).

ما هو التوليد المعزز بالجدول؟

تعدّ TAG نهجاً موحداً يعزز التفاعلات بين نماذج اللغة وقواعد البيانات، مما يوفر نموذجاً جديداً لاستغلال المعرفة العالمية وقدرات التفكير في نماذج اللغة. وفقاً لنتائج الباحثين، يمكّن TAG من إجراء استعلامات أكثر تعقيداً بلغة طبيعية على مصادر البيانات المخصصة.

كيف يعمل TAG؟

عندما يطرح المستخدمون أسئلة، يتم استخدام طريقتين رئيسيتين بشكل شائع: "النص إلى SQL" و"التوليد المعزز بالاسترجاع" (RAG). رغم فعاليتهما إلى حد ما، تعاني الطريقتان من مشكلات مع الاستعلامات المعقدة. يقوم النص إلى SQL بتحويل اللغة الطبيعية إلى استعلامات SQL، لكنه يتعامل فقط مع مجموعة محدودة من أسئلة الجبر العلاقي. بينما تركز RAG على البحث المباشر عن الإجابات ضمن عدد محدود من سجلات قاعدة البيانات.

غالباً ما تواجه الطريقتان صعوبات مع الأسئلة التي تتطلب التفكير الدلالي أو معرفة تتجاوز البيانات نفسها. كما أشار الباحثون، غالباً ما تتضمن الاستفسارات في العالم الحقيقي مزيجاً معقداً من الخبرة في المجالات والمعرفة العالمية والحساب الدقيق، وهي مجالات تتفوق فيها أنظمة قواعد البيانات التقليدية لكنها لا تكفي بمفردها.

لسد هذه الفجوة، يتبنى نهج TAG نموذجاً من ثلاث خطوات للاستعلام الحواري:

1. تركيب الاستعلام: يقوم نموذج اللغة بتحديد البيانات ذات الصلة وتحويل المدخلات إلى استعلام قابل للتنفيذ لقاعدة البيانات.

2. تنفيذ الاستعلام: يقوم محرك قاعدة البيانات بتشغيل الاستعلام ضد مستودعات البيانات الضخمة واسترجاع المعلومات الأكثر صلة.

3. توليد الإجابة: أخيراً، يقوم نموذج اللغة بتوليد استجابة بلغة طبيعية بناءً على نتائج الاستعلام المنفذ.

تسمح هذه الإطار المبتكر بدمج قدرات التفكير في نماذج اللغة مع تنفيذ استعلامات قاعدة البيانات بشكل قوي، مما يمكّن من التعامل مع أسئلة معقدة تتطلب تفكيراً دلالياً عميقاً، ومعرفة عالمية، وخبرة في المجال.

تحسين الأداء مع TAG

لتقييم فعالية TAG، استخدم الباحثون BIRD، وهي مجموعة بيانات مصممة لاختبار قدرات النص إلى SQL، وتكيفت لتشمل أسئلة تحتاج إلى تفكير دلالي. تم تقييم TAG مقابل عدة معايير، بما في ذلك النص إلى SQL وRAG.

أظهرت النتائج أنه بينما لم تحقق جميع الطرق الأساسية دقة تزيد عن 20%، تفوقت TAG بدقة تتجاوز 40%. أجابت نموذج TAG المكتوب يدوياً بشكل صحيح على 55% من الاستعلامات بشكل عام، مع معدل نجاح 65% في المقارنات المطابقة تماما. عبر أنواع الاستعلامات المختلفة، أظهرت TAG أداءً ثابتاً بأكثر من 50% دقة، وبرزت بشكل خاص في المقارنات المعقدة.

علاوة على ذلك، حققت تطبيقات TAG سرعات تنفيذ استعلامات أسرع بثلاث مرات مقارنةً بالأسس الأخرى، مما يظهر إمكانات الشركات في توحيد الذكاء الاصطناعي مع قدرات قواعد البيانات لاستخراج رؤى قيمة دون الحاجة إلى جهود برمجة مكثفة.

بينما تظهر TAG نتائج واعدة، هناك حاجة لتحسين أعمق. يقترح فريق البحث استكشاف إضافي لتصميم نظام TAG بشكل فعال. لدعم التجارب المستمرة، تم توفير معيار TAG المعدل على GitHub.

في الختام، يمثل TAG تقدماً مهماً في مجال الاستعلامات المعتمدة على الذكاء الاصطناعي، مما يمهد الطريق للشركات لتعزيز عمليات استخراج البيانات وقدرات اتخاذ القرار.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles