تحسين استعلامات مجموعات البيانات المعقدة: كيف تتفوق تقنية توليد الجداول المساعدة على تحويل النص إلى SQL

Home أخبار الذكاء الاصطناعي تحسين استعلامات مجموعات البيانات المعقدة: كيف تتفوق تقنية توليد الجداول المساعدة على تحويل النص إلى SQL

Updated on سبتمبر 2 2024

لقد غيرت الذكاء الاصطناعي طريقة عمل الشركات وإدارة البيانات. قبل بضع سنوات، كان يتعين على الفرق كتابة استعلامات SQL وكتابة التعليمات البرمجية لاستخراج رؤى قيمة من مجموعات البيانات الكبيرة. اليوم، يمكنهم ببساطة كتابة سؤال وترك أنظمة نماذج اللغة المتقدمة تتولى الباقي، مما يتيح تفاعلات سريعة وبديهية مع بياناتهم.

على الرغم من وعد هذه الأنظمة الجديدة للاستعلام، تظل هناك تحديات قائمة. تواجه النماذج الحالية صعوبات في معالجة نطاق واسع من الاستفسارات، مما دفع الباحثين من جامعة كاليفورنيا في بيركلي وستانفورد إلى تطوير حل جديد يسمى "التوليد المعزز بالجدول" (TAG).

ما هو التوليد المعزز بالجدول؟

تعدّ TAG نهجاً موحداً يعزز التفاعلات بين نماذج اللغة وقواعد البيانات، مما يوفر نموذجاً جديداً لاستغلال المعرفة العالمية وقدرات التفكير في نماذج اللغة. وفقاً لنتائج الباحثين، يمكّن TAG من إجراء استعلامات أكثر تعقيداً بلغة طبيعية على مصادر البيانات المخصصة.

كيف يعمل TAG؟

عندما يطرح المستخدمون أسئلة، يتم استخدام طريقتين رئيسيتين بشكل شائع: "النص إلى SQL" و"التوليد المعزز بالاسترجاع" (RAG). رغم فعاليتهما إلى حد ما، تعاني الطريقتان من مشكلات مع الاستعلامات المعقدة. يقوم النص إلى SQL بتحويل اللغة الطبيعية إلى استعلامات SQL، لكنه يتعامل فقط مع مجموعة محدودة من أسئلة الجبر العلاقي. بينما تركز RAG على البحث المباشر عن الإجابات ضمن عدد محدود من سجلات قاعدة البيانات.

غالباً ما تواجه الطريقتان صعوبات مع الأسئلة التي تتطلب التفكير الدلالي أو معرفة تتجاوز البيانات نفسها. كما أشار الباحثون، غالباً ما تتضمن الاستفسارات في العالم الحقيقي مزيجاً معقداً من الخبرة في المجالات والمعرفة العالمية والحساب الدقيق، وهي مجالات تتفوق فيها أنظمة قواعد البيانات التقليدية لكنها لا تكفي بمفردها.

لسد هذه الفجوة، يتبنى نهج TAG نموذجاً من ثلاث خطوات للاستعلام الحواري:

1. تركيب الاستعلام: يقوم نموذج اللغة بتحديد البيانات ذات الصلة وتحويل المدخلات إلى استعلام قابل للتنفيذ لقاعدة البيانات.

2. تنفيذ الاستعلام: يقوم محرك قاعدة البيانات بتشغيل الاستعلام ضد مستودعات البيانات الضخمة واسترجاع المعلومات الأكثر صلة.

3. توليد الإجابة: أخيراً، يقوم نموذج اللغة بتوليد استجابة بلغة طبيعية بناءً على نتائج الاستعلام المنفذ.

تسمح هذه الإطار المبتكر بدمج قدرات التفكير في نماذج اللغة مع تنفيذ استعلامات قاعدة البيانات بشكل قوي، مما يمكّن من التعامل مع أسئلة معقدة تتطلب تفكيراً دلالياً عميقاً، ومعرفة عالمية، وخبرة في المجال.

تحسين الأداء مع TAG

لتقييم فعالية TAG، استخدم الباحثون BIRD، وهي مجموعة بيانات مصممة لاختبار قدرات النص إلى SQL، وتكيفت لتشمل أسئلة تحتاج إلى تفكير دلالي. تم تقييم TAG مقابل عدة معايير، بما في ذلك النص إلى SQL وRAG.

أظهرت النتائج أنه بينما لم تحقق جميع الطرق الأساسية دقة تزيد عن 20%، تفوقت TAG بدقة تتجاوز 40%. أجابت نموذج TAG المكتوب يدوياً بشكل صحيح على 55% من الاستعلامات بشكل عام، مع معدل نجاح 65% في المقارنات المطابقة تماما. عبر أنواع الاستعلامات المختلفة، أظهرت TAG أداءً ثابتاً بأكثر من 50% دقة، وبرزت بشكل خاص في المقارنات المعقدة.

علاوة على ذلك، حققت تطبيقات TAG سرعات تنفيذ استعلامات أسرع بثلاث مرات مقارنةً بالأسس الأخرى، مما يظهر إمكانات الشركات في توحيد الذكاء الاصطناعي مع قدرات قواعد البيانات لاستخراج رؤى قيمة دون الحاجة إلى جهود برمجة مكثفة.

بينما تظهر TAG نتائج واعدة، هناك حاجة لتحسين أعمق. يقترح فريق البحث استكشاف إضافي لتصميم نظام TAG بشكل فعال. لدعم التجارب المستمرة، تم توفير معيار TAG المعدل على GitHub.

في الختام، يمثل TAG تقدماً مهماً في مجال الاستعلامات المعتمدة على الذكاء الاصطناعي، مما يمهد الطريق للشركات لتعزيز عمليات استخراج البيانات وقدرات اتخاذ القرار.

تعمل GenRM من DeepMind على تحسين دقة نماذج اللغات الكبيرة (LLMs) من خلال التحقق الذاتي من النتائج.

تمنح OpenAI المطورين تحكمًا متقدمًا في مساعدي الذكاء الاصطناعي

Most people like

Dubverse

365.4K

دوبفورس هو منصة مبتكرة مدعومة بالذكاء الاصطناعي تهدف لمساعدة المبدعين في دبلجة مقاطع الفيديو الخاصة بهم بسهولة إلى عدة لغات بسرعة مذهلة. هذه الأداة القوية تبسط عملية الدبلجة، مما يزيد من إمكانية الوصول ووسع نطاق الجمهور.

أخرى AI Script Writing

Faraday

16.3K

افتح آفاق إمكانيات التنبؤات المدعومة بالذكاء الاصطناعي لتحفيز نمو الأعمال بسرعة. من خلال الاستفادة من الخوارزميات المتقدمة، يمكن للشركات الحصول على رؤى قيمة حول سلوك العملاء، وزيادة التفاعل، وتعزيز الإيرادات. اكتشف كيف يمكن أن يغير دمج الذكاء الاصطناعي في استراتيجيتك من طريقة فهمك وتوقعك لاحتياجات العملاء.

الذكاء الاصطناعي Other

Speak Ai

89.8K

في المشهد الرقمي اليوم، تلعب برامج النسخ والبحث وتحليل البيانات ومعالجة اللغة الطبيعية (NLP) أدوارًا حيوية في استغلال المعلومات بشكل فعال. تمكّن هذه الأدوات الشركات والباحثين من تحويل الصوت إلى نص، والتحويل من البيانات الخام إلى رؤى قابلة للتنفيذ، وتحليل أنماط اللغة. من خلال الاستفادة من هذه التقنيات، يمكن للمنظمات زيادة الإنتاجية، وتعزيز الابتكار، واتخاذ قرارات مستنيرة، مما يؤدي في النهاية إلى تحقيق نجاح أكبر في مجالاتهم المختلفة.

نسخ Large Language Models (LLMs)

Shortspilot

87.3K

نقدم لكم أداة مبتكرة تعتمد على الذكاء الصناعي تهدف إلى أتمتة إنشاء ونشر مقاطع الفيديو القصيرة بكل سهولة. تقوم هذا البرنامج القوي بتبسيط العملية بأكملها، مما يتيح للمستخدمين إنتاج محتوى فيديو جذاب بسرعة وكفاءة. بفضل واجهته سهلة الاستخدام، يحول أفكارك إلى مقاطع فيديو مثيرة في وقت قصير، مما يجعلها موردًا أساسيًا لصانعي المحتوى والمسوقين على حد سواء. عزز وجودك على الإنترنت وزيِّن تفاعلك مع هذه الحلول الرائدة لأتمتة مقاطع الفيديو القصيرة.

الذكاء الاصطناعي AI Social Media Assistant

Find AI tools in YBX