ثورة جاليليو في تقييم GenAI: تخفيض التكلفة بنسبة 97% وتحسين السرعة بمعدل 11 ضعفاً

غاليلو تعيد تعريف تقييم الذكاء الاصطناعي مع "لونا": تغيير قواعد اللعبة للشركات

قدمت شركة غاليلو، الرائدة في مجال الذكاء الاصطناعي التوليدي للأعمال، "لونا"، مجموعة ثورية من نماذج التقييم الأساسية (EFMs) التي تهدف إلى تحويل طريقة تقييم الشركات لأنظمة الذكاء الاصطناعي التوليدي لديها. تعالج "لونا" التحديات الأساسية التي كانت تعيق قبول الذكاء الاصطناعي التوليدي في بيئات الإنتاج، وهي السرعة والتكلفة والدقة.

قال فيكرام تشاترجي، المؤسس المشارك والرئيس التنفيذي لشركة غاليلو: "أنشأت غاليلو لونا لتجاوز عيوب طرق تقييم الذكاء الاصطناعي التوليدي الحالية، التي غالبًا ما تكون بطيئة ومكلفة وغير دقيقة. لقد أدركنا الحاجة إلى تقييمات ذات زمن استجابة منخفض للغاية، وبتكاليف معقولة، ودقة عالية في بيئات الإنتاج."

محطة مهمة في تقييم الذكاء الاصطناعي

يعتبر إطلاق "لونا" خطوة محورية لشركة غاليلو، التي كانت رائدة في الذكاء الاصطناعي التوليدي للأعمال منذ أوائل عام 2021. وتظهر التزام الشركة بتقدم تقييم الذكاء الاصطناعي من خلال ما يقرب من عام من البحث والتطوير المكثف الذي culminated في تطوير لونا.

تحقق "لونا" أداءً متفوقًا في اختبار مرجعي، حيث سجلت درجة AUROC تبلغ 0.78. وهذا يتجاوز المنافسين الرائدين مثل GPT-3.5 وTrulens Groundedness وRAGAS Faithfulness.

نماذج مخصصة تعيد تعريف معايير التقييم

تتضمن ابتكارات "لونا" نماذج لغوية صغيرة مصممة خصيصًا لمهام تقييم مثل كشف الهلوسة، وتقييم جودة السياق، ومنع تسرب البيانات، وتحديد الطلبات الخبيثة. يتيح هذا التركيز المتخصص لـ "لونا" التفوق في ثلاثة مقاييس رئيسية: السرعة والتكلفة والدقة.

أوضح تشاترجي: "من خلال استخدام نماذج لغوية صغيرة مصممة خصيصاً، تحقق لونا تقييمات تكلفتها 97% أقل وسرعة أعلى بـ 11 مرة مقارنة بتلك التي تتم باستخدام GPT-3.5." بالإضافة إلى ذلك، تتفوق "لونا" على الطرق السابقة بنسبة تصل إلى 20% في كشف قضايا مثل الهلوسة والمعلومات الشخصية القابلة للتعريف (PII).

في تحليل تكاليف تقييم مليوني استعلام شهريًا، تتطلب "لونا" فقط 175 دولارًا، مما يجعلها فعالة من حيث التكلفة بشكل ملحوظ مقارنةً بـ GPT-3.5 (6,248 دولارًا) وRAGAS Faithfulness (7,994 دولارًا) وTrulens Groundedness (16,641 دولارًا).

ابتكار بدون مجموعات بيانات تقليدية

تعتبر قدرة "لونا" على العمل دون الاعتماد على مجموعات البيانات التقليدية من أبرز مميزاتها. من خلال استخدام نماذج تقييم مُدربة مسبقًا تم تحسينها على مجموعات بيانات متنوعة خاصة بالنطاق، تبسط "لونا" عملية التقييم، مما يزيل الحاجة لمجموعات اختبار مخصصة تستغرق وقتًا طويلاً.

يمكن أن تكون تطبيقات "لونا" واسعة النطاق. وأشار تشاترجي إلى فعاليتها في الصناعات التي تتطلب موثوقية عالية، مثل الرعاية الصحية والمالية والاتصالات. وأضاف: "تتميز لونا بقوة خاصة لتطبيقات المؤسسات الكبرى التي تتعامل مع ملايين الاستفسارات شهريًا."

سرعة لا مثيل لها وتحسين مستمر

توفر "لونا" من غاليلو سرعة استثنائية، معالجة استعلام واحد في 0.232 ثانية، وهو تحسين كبير مقارنة بالمنافسين مثل GPT-3.5 (2.5 ثانية) وRAGAS Faithfulness (5.4 ثانية).

تمتد حالات استخدام "لونا" من مراقبة نتائج الذكاء الاصطناعي في الوقت الفعلي إلى ضمان سلامة تفاعلات الدردشة. ومع منتج Fine Tune من غاليلو، يمكن تخصيص "لونا" لتلبية احتياجات العملاء المحددة، مما يحقق مستويات دقة تبلغ 95% أو أعلى في القطاعات الحيوية، بما في ذلك الأدوية والخدمات المالية.

بينما يتطور مشهد الذكاء الاصطناعي التوليدي، تبقى غاليلو ملتزمة بالابتكار المستمر مع "لونا"، مع التركيز على توسيع دعم المهام، وتعزيز الدقة، وتقليل التكاليف والزمن.

قال تشاترجي: "تلتزم غاليلو بتقدم تقييم الذكاء الاصطناعي، مما يساعد المؤسسات على نشر حلول ذكاء اصطناعي موثوقة. مع استمرار تطور الذكاء الاصطناعي التوليدي، سنوفر للعملاء إمكانيات متطورة تعزز ثقة المستخدمين."

مع إطلاق "لونا"، عززت غاليلو مكانتها كرائد في تقييم الذكاء الاصطناعي التوليدي للأعمال. بينما تسعى الشركات للاستفادة من إمكانيات الذكاء الاصطناعي التوليدي، ستساهم تقييمات "لونا" السريعة والفعالة من حيث التكلفة والدقيقة في دفع اعتماد هذه التكنولوجيا التحولية على نطاق واسع.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles