ثورة جاليليو في تقييم GenAI: تخفيض التكلفة بنسبة 97% وتحسين السرعة بمعدل 11 ضعفاً

Home أخبار الذكاء الاصطناعي ثورة جاليليو في تقييم GenAI: تخفيض التكلفة بنسبة 97% وتحسين السرعة بمعدل 11 ضعفاً

Updated on يونيو 6 2024

غاليلو تعيد تعريف تقييم الذكاء الاصطناعي مع "لونا": تغيير قواعد اللعبة للشركات

قدمت شركة غاليلو، الرائدة في مجال الذكاء الاصطناعي التوليدي للأعمال، "لونا"، مجموعة ثورية من نماذج التقييم الأساسية (EFMs) التي تهدف إلى تحويل طريقة تقييم الشركات لأنظمة الذكاء الاصطناعي التوليدي لديها. تعالج "لونا" التحديات الأساسية التي كانت تعيق قبول الذكاء الاصطناعي التوليدي في بيئات الإنتاج، وهي السرعة والتكلفة والدقة.

قال فيكرام تشاترجي، المؤسس المشارك والرئيس التنفيذي لشركة غاليلو: "أنشأت غاليلو لونا لتجاوز عيوب طرق تقييم الذكاء الاصطناعي التوليدي الحالية، التي غالبًا ما تكون بطيئة ومكلفة وغير دقيقة. لقد أدركنا الحاجة إلى تقييمات ذات زمن استجابة منخفض للغاية، وبتكاليف معقولة، ودقة عالية في بيئات الإنتاج."

محطة مهمة في تقييم الذكاء الاصطناعي

يعتبر إطلاق "لونا" خطوة محورية لشركة غاليلو، التي كانت رائدة في الذكاء الاصطناعي التوليدي للأعمال منذ أوائل عام 2021. وتظهر التزام الشركة بتقدم تقييم الذكاء الاصطناعي من خلال ما يقرب من عام من البحث والتطوير المكثف الذي culminated في تطوير لونا.

تحقق "لونا" أداءً متفوقًا في اختبار مرجعي، حيث سجلت درجة AUROC تبلغ 0.78. وهذا يتجاوز المنافسين الرائدين مثل GPT-3.5 وTrulens Groundedness وRAGAS Faithfulness.

نماذج مخصصة تعيد تعريف معايير التقييم

تتضمن ابتكارات "لونا" نماذج لغوية صغيرة مصممة خصيصًا لمهام تقييم مثل كشف الهلوسة، وتقييم جودة السياق، ومنع تسرب البيانات، وتحديد الطلبات الخبيثة. يتيح هذا التركيز المتخصص لـ "لونا" التفوق في ثلاثة مقاييس رئيسية: السرعة والتكلفة والدقة.

أوضح تشاترجي: "من خلال استخدام نماذج لغوية صغيرة مصممة خصيصاً، تحقق لونا تقييمات تكلفتها 97% أقل وسرعة أعلى بـ 11 مرة مقارنة بتلك التي تتم باستخدام GPT-3.5." بالإضافة إلى ذلك، تتفوق "لونا" على الطرق السابقة بنسبة تصل إلى 20% في كشف قضايا مثل الهلوسة والمعلومات الشخصية القابلة للتعريف (PII).

في تحليل تكاليف تقييم مليوني استعلام شهريًا، تتطلب "لونا" فقط 175 دولارًا، مما يجعلها فعالة من حيث التكلفة بشكل ملحوظ مقارنةً بـ GPT-3.5 (6,248 دولارًا) وRAGAS Faithfulness (7,994 دولارًا) وTrulens Groundedness (16,641 دولارًا).

ابتكار بدون مجموعات بيانات تقليدية

تعتبر قدرة "لونا" على العمل دون الاعتماد على مجموعات البيانات التقليدية من أبرز مميزاتها. من خلال استخدام نماذج تقييم مُدربة مسبقًا تم تحسينها على مجموعات بيانات متنوعة خاصة بالنطاق، تبسط "لونا" عملية التقييم، مما يزيل الحاجة لمجموعات اختبار مخصصة تستغرق وقتًا طويلاً.

يمكن أن تكون تطبيقات "لونا" واسعة النطاق. وأشار تشاترجي إلى فعاليتها في الصناعات التي تتطلب موثوقية عالية، مثل الرعاية الصحية والمالية والاتصالات. وأضاف: "تتميز لونا بقوة خاصة لتطبيقات المؤسسات الكبرى التي تتعامل مع ملايين الاستفسارات شهريًا."

سرعة لا مثيل لها وتحسين مستمر

توفر "لونا" من غاليلو سرعة استثنائية، معالجة استعلام واحد في 0.232 ثانية، وهو تحسين كبير مقارنة بالمنافسين مثل GPT-3.5 (2.5 ثانية) وRAGAS Faithfulness (5.4 ثانية).

تمتد حالات استخدام "لونا" من مراقبة نتائج الذكاء الاصطناعي في الوقت الفعلي إلى ضمان سلامة تفاعلات الدردشة. ومع منتج Fine Tune من غاليلو، يمكن تخصيص "لونا" لتلبية احتياجات العملاء المحددة، مما يحقق مستويات دقة تبلغ 95% أو أعلى في القطاعات الحيوية، بما في ذلك الأدوية والخدمات المالية.

بينما يتطور مشهد الذكاء الاصطناعي التوليدي، تبقى غاليلو ملتزمة بالابتكار المستمر مع "لونا"، مع التركيز على توسيع دعم المهام، وتعزيز الدقة، وتقليل التكاليف والزمن.

قال تشاترجي: "تلتزم غاليلو بتقدم تقييم الذكاء الاصطناعي، مما يساعد المؤسسات على نشر حلول ذكاء اصطناعي موثوقة. مع استمرار تطور الذكاء الاصطناعي التوليدي، سنوفر للعملاء إمكانيات متطورة تعزز ثقة المستخدمين."

مع إطلاق "لونا"، عززت غاليلو مكانتها كرائد في تقييم الذكاء الاصطناعي التوليدي للأعمال. بينما تسعى الشركات للاستفادة من إمكانيات الذكاء الاصطناعي التوليدي، ستساهم تقييمات "لونا" السريعة والفعالة من حيث التكلفة والدقيقة في دفع اعتماد هذه التكنولوجيا التحولية على نطاق واسع.

زايبرا تطلق زيدا: مجموعة بيانات لنمذجة اللغة بحجم 1.3 تيرابايت تدعي أنها تتفوق على بايل وC4 وarXiv.

أدوبي تتعامل مع المخاوف المتزايدة بشأن لغة شروط الخدمة الجديدة المثيرة للجدل

Most people like

Friends & Fables

133.4K

اكتشف تجربة D&D 5e كما لم يحدث من قبل مع مدير ألعاب بالذكاء الاصطناعي. استمتع بمغامرات فردية أو شارك في حملات متعددة اللاعبين، كل ذلك في وقت يناسبك—في أي وقت، ومن أي مكان. استكشف الاحتمالات اللامحدودة لألعاب الطاولة بفضل قوة الذكاء الاصطناعي!

D&D 5e Other

Otter.ai

6.1M

أوتير.آي هي منصة متطورة مصممة لتدوين الملاحظات التلقائي، والتفريغات، والملخصات للاجتماعات، مما يعزز الإنتاجية ويعزز التعاون الفعّال في مكان العمل.

ملاحظات الاجتماع AI Chatbot

Maths-Whizz

141.3K

نقدم لكم معلم الرياضيات الافتراضي المدعوم بالذكاء الاصطناعي المصمم خصيصًا للأطفال من سن 5 إلى 13 عامًا. يُوفر هذا الأداة المبتكرة تجارب تعليمية مخصصة، تساعد المتعلمين الصغار على فهم المفاهيم الرياضية بطريقة مشوقة. مع دروس تفاعلية، وتغذية راجعة في الوقت الحقيقي، وتمارين ممارسة مخصصة، يُعزز معلمنا الافتراضي الثقة ويغرس حب الرياضيات. سواء كان طفلك يحتاج إلى مساعدة في الحسابات الأساسية أو في مواضيع أكثر تقدمًا، فإن معلمنا الافتراضي يتكيف مع وتيرة تعلمه الفردية، مما يجعل الرياضيات ممتعة وميسرة لكل طفل.

المعلم الافتراضي الذكي AI Coaching

MindBridge AI

25.3K

في ظل التطورات السريعة التي تشهدها الساحة المالية اليوم، يُعَدّ التنقل بين المخاطر أمرًا بالغ الأهمية للنجاح. بصفتنا رائدين عالميين في اكتشاف المخاطر المالية، نمتلك تخصصًا فريدًا في تحديد وتخفيف التهديدات المحتملة للأصول والاستثمارات. تمكّن حلولنا المبتكرة الشركات من حماية صحتها المالية وتعزيز اتخاذ القرارات من خلال استراتيجيات شاملة لتقييم وإدارة المخاطر. انضم إلينا ونحن نعيد تعريف معايير اكتشاف المخاطر المالية لضمان مرونة ونمو منظمتك.

اكتشاف المخاطر المالية AI Analytics Assistant

Find AI tools in YBX