غريتيل تكشف عن أكبر مجموعة بيانات مفتوحة المصدر لتحويل النص إلى SQL في العالم، مما يتيح للشركات الاستفادة من الإمكانات الكاملة للذكاء الاصطناعي.

غريتل، الرائدة في مجال البيانات الاصطناعية، اتخذت خطوة هامة نحو دمقرطة الوصول إلى بيانات تدريب الذكاء الاصطناعي عالية الجودة. يوم الخميس، أعلنت الشركة عن أكبر مجموعة بيانات مفتوحة المصدر في العالم لتحويل النص إلى SQL، وهو ما من المتوقع أن يعجل تدريب نماذج الذكاء الاصطناعي ويوفر فرصاً جديدة للشركات في جميع أنحاء العالم.

تتكون مجموعة البيانات من أكثر من 100,000 عينة اصطناعية مُحضَّرة بعناية لتحويل النص إلى SQL، موزعة على 100 قطاع، ومتاحة الآن على منصة Hugging Face تحت رخصة Apache 2.0. تهدف هذه المبادرة إلى تمكين المطورين بالأدوات اللازمة لإنشاء نماذج ذكاء اصطناعي قوية قادرة على تفسير الاستفسارات باللغة الطبيعية وتوليد SQL، وبالتالي ربط المستخدمين التجاريين بمصادر البيانات المعقدة.

قال ييف ماير، كبير العلماء في غريتل: "الوصول إلى بيانات التدريب عالية الجودة يعد أحد أكبر التحديات في الذكاء الاصطناعي الناتج. يمكن للبيانات الاصطناعية عالية الجودة أن تسد هذه الفجوة، خاصةً مع التطورات الأخيرة في نماذج اللغة الكبيرة التي تبرز أهمية جودة البيانات."

مواجهة تحديات جودة البيانات

تم إنشاء مجموعة البيانات المبتكرة الخاصة بغريتل باستخدام نظام AI مركب متطور يُعرف باسم غريتل نافيجاتور، الذي هو حالياً تحت المعاينة العامة. أوضح ماير: "تم تصميم مجموعة البيانات المفتوحة المصدر لتحويل النص إلى SQL بواسطة غريتل نافيجاتور، الذي يدمج تنفيذ يعتمد على الوكلاء، ومجموعة من النماذج الملكية، وتقنيات تعزيز الخصوصية لإنتاج بيانات اصطناعية عالية الجودة عند الطلب."

تواجه الشركات صعوبة في الوصول إلى واستخدام كميات هائلة من البيانات المخزنة في قواعد بيانات معقدة، ومستودعات البيانات، وبحيرات البيانات. بالإضافة إلى ذلك، تحتوي مجموعة البيانات على حقل شرح يوفر أوصافاً بلغة بسيطة لشفرة SQL، مما يسهل استخراج رؤى قيمة للمستخدمين النهائيين.

تحقق صارم وتطبيقات متنوعة

يتضح التزام غريتل بجودة البيانات من خلال عمليات التحقق الدقيقة التي تتبعها. قال ماير: "تمر كل مجموعة بيانات نقوم بإنشائها بعملية تقييم الجودة. يعد معيار الجودة جزءاً أساسياً من عملياتنا." وقد تجاوزت مجموعة بيانات تحويل النص إلى SQL بشكل متواصل غيرها من حيث الامتثال لمعايير SQL، والدقة، والامتثال للتعليمات، وفقًا لتقنية القاضي المستقلة باستخدام نماذج اللغة الكبيرة.

تفوقت مجموعة البيانات الاصطناعية لتحويل النص إلى SQL على مجموعة b-mc2/sql-create-context في عدة معايير تقييم: الالتزام بمعايير SQL (+54.6%)، دقة SQL (+34.5%)، والامتثال للتعليمات (+8.5%).

تطبيقات واسعة في الصناعة

تتمتع مجموعة بيانات غريتل بإمكانات استخدام واسعة، تمتد عبر قطاعات المالية والرعاية الصحية والحكومة. يمكن للمحللين الماليين استعلام معلومات قواعد البيانات حول أداء الشركات على الفور، بينما يستطيع مقدمو الرعاية الصحية تبسيط تحليل بيانات التجارب السريرية. يمكن للمسؤولين الحكوميين الاستفادة من مجموعة البيانات لتعزيز الوصول العام إلى السجلات مثل التراخيص، ملكية الممتلكات، والتصاريح.

أولوية الخصوصية والوصول

بينما تعي المؤسسات أهمية الذكاء الاصطناعي المعتمد على البيانات، فإن قدرة غريتل على إنتاج كميات كبيرة من البيانات الاصطناعية عالية الجودة تجعلها لاعباً محورياً في الصناعة. أوضح ماير: "تم تصميم حلول غريتل لتلبية احتياجات المؤسسات الكبيرة، حيث تقدم للعملاء الوسائل لإنشاء بيانات من الصفر أو تعزيز مجموعات البيانات الموجودة."

التزام غريتل بالخصوصية متقدم بنفس القدر، حيث تستخدم تقنيات مثل الخصوصية التفاضلية لحماية المعلومات الحساسة مع السماح للنماذج بالتعلم من البيانات. يميز هذا التركيز على التوازن بين الدقة والخصوصية غريتل في صناعة تُعلي من شأن أمان البيانات.

علامة فارقة للذكاء الاصطناعي المعتمد على البيانات

تعدُّ إطلاق مجموعة بيانات غريتل لتحويل النص إلى SQL لحظة حاسمة في مهمة الشركة لتعزيز اعتماد الذكاء الاصطناعي المعتمد على البيانات، مما يمكّن الشركات من فتح الإمكانيات الكاملة لبياناتها. مع التركيز على الجودة والخصوصية والوصول، تستعد غريتل لقيادة ثورة البيانات الاصطناعية.

مع تطور مشهد الذكاء الاصطناعي بسرعة، تسلط مساهمة غريتل الرائدة في المجتمع المفتوح الضوء على التزامها بالابتكار ودمقرطة الوصول إلى بيانات التدريب عالية الجودة. سيكون لهذا الإطلاق تأثير كبير عبر الصناعات بينما تستفيد الشركات من الذكاء الاصطناعي لتعزيز قدرتها التنافسية في بيئة تزداد اعتماداً على البيانات.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles