ضمان نشر آمن لنماذج الذكاء الاصطناعي في الأعمال
تسعى الشركات التي تهدف إلى تنفيذ نماذج الذكاء الاصطناعي في عملياتها—سواء للموظفين أو العملاء—إلى طرح سؤال محوري: متى يكون النموذج المحدد آمنًا للنشر؟ وليس مجرد اختيار النموذج أو استخدامه.
ما مقدار الاختبارات اللازمة على النظام الخلفي؟ وما الأنواع المطلوبة من الاختبارات؟ تسعى الشركات، بشكل مفهوم، لتجنب حدوث أخطاء مشابهة لتلك التي واجهتها بعض وكالات السيارات التي استخدمت ChatGPT لدعم العملاء، حيث تمكن المستخدمون من خداع النظام للموافقة على بيع سيارات مقابل دولار واحد.
أهمية الاختبار الشامل
يمكن أن يكون الاختبار الجيد لنماذج الذكاء الاصطناعي، خاصة النسخ المعدلة بدقة، الفارق بين إطلاق ناجح وواحد قد يهدد سمعة الشركة وماليتها. أعلنت شركة Kolena، وهي شركة ناشئة تأسست في سان فرانسيسكو على يد مدير هندسي سابق في أمازون، مؤخرًا عن إطلاق منصتها لجودة الذكاء الاصطناعي. هذه التطبيق الويب مصمم لتسهيل الاختبار السريع والدقيق والتحقق من أنظمة الذكاء الاصطناعي.
تشمل المنصة وظائف متنوعة، مثل مراقبة جودة البيانات، اختبار النماذج، الاختبارات A/B، ومراقبة التغيرات في البيانات وتدهور النماذج بمرور الوقت، بالإضافة إلى قدرات تصحيح الأخطاء.
قال محمد الجندي، المؤسس المشارك والرئيس التنفيذي لشركة Kolena، خلال مقابلة حصرية مع الإعلام: "حل هذه المشكلة أمر ضروري لتقدم تبني الذكاء الاصطناعي في المؤسسات". يتمتع الجندي بخبرة قيمة من أدواره السابقة كنائب رئيس هندسة في Rakuten ومدير هندسي أول في أمازون، مما يمنحه بصيرة حول التحديات التي تواجهها المؤسسات مع نشر الذكاء الاصطناعي.
كيفية عمل منصة Kolena لجودة الذكاء الاصطناعي
تهدف حلول Kolena إلى مساعدة مطوري البرمجيات وفنيي تكنولوجيا المعلومات في إنشاء أنظمة ذكاء اصطناعي آمنة وموثوقة وعادلة للتطبيقات العملية. من خلال تمكين التطوير السريع لحالات اختبار مفصلة من مجموعات البيانات، تسمح المنصة بإجراء فحص دقيق لنماذج الذكاء الاصطناعي/تعلّم الآلة في سيناريوهات واقعية، بعيدًا عن المقاييس الإحصائية العامة التي قد تغفل عن رؤى الأداء الحيوية.
ترتبط كل عميل لـ Kolena بالنموذج المختار من خلال واجهة برمجة التطبيقات (API) ويزود مجموعة بياناته بالإضافة إلى متطلبات وظيفية لعمليات النموذج—سواء كانت نصوصًا أو صورًا أو شفرة أو صوتًا أو محتوى آخر. يمكن للعملاء أيضًا تقييم سمات مثل الانحياز وتنوع العمر والعرق والاثنية عبر مقاييس مختلفة. تقوم Kolena بإجراء اختبارات تحاكي مئات أو آلاف التفاعلات لتحديد أي نتائج غير مرغوب فيها، بما في ذلك مدى تكرار حدوثها وتحت أي ظروف.
علاوة على ذلك، تعيد Kolena اختبار النماذج بعد التحديثات أو إعادة التدريب أو التعديلات التي يقوم بها المزودون أو العملاء.
ويوضح الجندي: "سنجري اختبارات وسنحدد بالضبط أين تدهور نموذجك. تتحول Kolena الاختبار إلى تخصص هندسي دقيق، مثل تطوير البرمجيات".
تُعتبر هذه القدرة ذات قيمة ليس فقط للمؤسسات ولكن أيضًا لمزودي نماذج الذكاء الاصطناعي. على سبيل المثال، أشار الجندي إلى أن نظام Gemini الخاص بـ Google، الذي واجه تدقيقًا بسبب توليد صور غير دقيقة، كان يمكن أن يستفيد من الاختبارات الدقيقة التي توفرها منصة Kolena قبل إطلاقه.
اختبارات شاملة قبل الإطلاق
تماشيًا مع طموحاتها، تضمن Kolena إجراء اختبارات شاملة على منصتها لجودة الذكاء الاصطناعي قبل الإطلاق الأوسع. حيث قامت الشركة بإجراء اختبارات تجريبية مغلقة مع شركات Fortune 500 والشركات الناشئة على مدار الـ 24 شهرًا الماضية، مستندة على ملاحظات واحتياجات المستخدمين.
قال الجندي: "عملنا بشكل وثيق مع مجموعة مختارة من العملاء لتحديد التحديات المعروفة وغير المعروفة". نفذت هذه المجموعة بشكل جماعي "عشرات الآلاف" من الاختبارات على نماذج الذكاء الاصطناعي باستخدام منصة Kolena.
نظرًا للمستقبل، تسعى Kolena للتواصل مع العملاء في ثلاثة مجالات رئيسية: 1. مطورو نماذج الأساس للذكاء الاصطناعي، 2. المشترون في قطاع التكنولوجيا، و3. المشترون من القطاعات غير التكنولوجية. على سبيل المثال، يستخدم أحد الشركاء حل نموذج لغوي كبير لتحسين عمليات السيارات السريعة، بينما يستهدف شريك آخر مطوري المركبات الذاتية القيادة.
التسعير والوصول
تعمل منصة Kolena لجودة الذكاء الاصطناعي على نموذج البرمجيات كخدمة (SaaS)، featuring three pricing tiers that scale with a company's AI growth, from initial data quality assessments to model training and eventual deployment.