كولينا تطلق منصة مبتكرة لاختبار نماذج الذكاء الاصطناعي والمتغيرات المخصصة

Home أخبار الذكاء الاصطناعي كولينا تطلق منصة مبتكرة لاختبار نماذج الذكاء الاصطناعي والمتغيرات المخصصة

Updated on مارس 13 2024

ضمان نشر آمن لنماذج الذكاء الاصطناعي في الأعمال

تسعى الشركات التي تهدف إلى تنفيذ نماذج الذكاء الاصطناعي في عملياتها—سواء للموظفين أو العملاء—إلى طرح سؤال محوري: متى يكون النموذج المحدد آمنًا للنشر؟ وليس مجرد اختيار النموذج أو استخدامه.

ما مقدار الاختبارات اللازمة على النظام الخلفي؟ وما الأنواع المطلوبة من الاختبارات؟ تسعى الشركات، بشكل مفهوم، لتجنب حدوث أخطاء مشابهة لتلك التي واجهتها بعض وكالات السيارات التي استخدمت ChatGPT لدعم العملاء، حيث تمكن المستخدمون من خداع النظام للموافقة على بيع سيارات مقابل دولار واحد.

أهمية الاختبار الشامل

يمكن أن يكون الاختبار الجيد لنماذج الذكاء الاصطناعي، خاصة النسخ المعدلة بدقة، الفارق بين إطلاق ناجح وواحد قد يهدد سمعة الشركة وماليتها. أعلنت شركة Kolena، وهي شركة ناشئة تأسست في سان فرانسيسكو على يد مدير هندسي سابق في أمازون، مؤخرًا عن إطلاق منصتها لجودة الذكاء الاصطناعي. هذه التطبيق الويب مصمم لتسهيل الاختبار السريع والدقيق والتحقق من أنظمة الذكاء الاصطناعي.

تشمل المنصة وظائف متنوعة، مثل مراقبة جودة البيانات، اختبار النماذج، الاختبارات A/B، ومراقبة التغيرات في البيانات وتدهور النماذج بمرور الوقت، بالإضافة إلى قدرات تصحيح الأخطاء.

قال محمد الجندي، المؤسس المشارك والرئيس التنفيذي لشركة Kolena، خلال مقابلة حصرية مع الإعلام: "حل هذه المشكلة أمر ضروري لتقدم تبني الذكاء الاصطناعي في المؤسسات". يتمتع الجندي بخبرة قيمة من أدواره السابقة كنائب رئيس هندسة في Rakuten ومدير هندسي أول في أمازون، مما يمنحه بصيرة حول التحديات التي تواجهها المؤسسات مع نشر الذكاء الاصطناعي.

كيفية عمل منصة Kolena لجودة الذكاء الاصطناعي

تهدف حلول Kolena إلى مساعدة مطوري البرمجيات وفنيي تكنولوجيا المعلومات في إنشاء أنظمة ذكاء اصطناعي آمنة وموثوقة وعادلة للتطبيقات العملية. من خلال تمكين التطوير السريع لحالات اختبار مفصلة من مجموعات البيانات، تسمح المنصة بإجراء فحص دقيق لنماذج الذكاء الاصطناعي/تعلّم الآلة في سيناريوهات واقعية، بعيدًا عن المقاييس الإحصائية العامة التي قد تغفل عن رؤى الأداء الحيوية.

ترتبط كل عميل لـ Kolena بالنموذج المختار من خلال واجهة برمجة التطبيقات (API) ويزود مجموعة بياناته بالإضافة إلى متطلبات وظيفية لعمليات النموذج—سواء كانت نصوصًا أو صورًا أو شفرة أو صوتًا أو محتوى آخر. يمكن للعملاء أيضًا تقييم سمات مثل الانحياز وتنوع العمر والعرق والاثنية عبر مقاييس مختلفة. تقوم Kolena بإجراء اختبارات تحاكي مئات أو آلاف التفاعلات لتحديد أي نتائج غير مرغوب فيها، بما في ذلك مدى تكرار حدوثها وتحت أي ظروف.

علاوة على ذلك، تعيد Kolena اختبار النماذج بعد التحديثات أو إعادة التدريب أو التعديلات التي يقوم بها المزودون أو العملاء.

ويوضح الجندي: "سنجري اختبارات وسنحدد بالضبط أين تدهور نموذجك. تتحول Kolena الاختبار إلى تخصص هندسي دقيق، مثل تطوير البرمجيات".

تُعتبر هذه القدرة ذات قيمة ليس فقط للمؤسسات ولكن أيضًا لمزودي نماذج الذكاء الاصطناعي. على سبيل المثال، أشار الجندي إلى أن نظام Gemini الخاص بـ Google، الذي واجه تدقيقًا بسبب توليد صور غير دقيقة، كان يمكن أن يستفيد من الاختبارات الدقيقة التي توفرها منصة Kolena قبل إطلاقه.

اختبارات شاملة قبل الإطلاق

تماشيًا مع طموحاتها، تضمن Kolena إجراء اختبارات شاملة على منصتها لجودة الذكاء الاصطناعي قبل الإطلاق الأوسع. حيث قامت الشركة بإجراء اختبارات تجريبية مغلقة مع شركات Fortune 500 والشركات الناشئة على مدار الـ 24 شهرًا الماضية، مستندة على ملاحظات واحتياجات المستخدمين.

قال الجندي: "عملنا بشكل وثيق مع مجموعة مختارة من العملاء لتحديد التحديات المعروفة وغير المعروفة". نفذت هذه المجموعة بشكل جماعي "عشرات الآلاف" من الاختبارات على نماذج الذكاء الاصطناعي باستخدام منصة Kolena.

نظرًا للمستقبل، تسعى Kolena للتواصل مع العملاء في ثلاثة مجالات رئيسية: 1. مطورو نماذج الأساس للذكاء الاصطناعي، 2. المشترون في قطاع التكنولوجيا، و3. المشترون من القطاعات غير التكنولوجية. على سبيل المثال، يستخدم أحد الشركاء حل نموذج لغوي كبير لتحسين عمليات السيارات السريعة، بينما يستهدف شريك آخر مطوري المركبات الذاتية القيادة.

التسعير والوصول

تعمل منصة Kolena لجودة الذكاء الاصطناعي على نموذج البرمجيات كخدمة (SaaS)، featuring three pricing tiers that scale with a company's AI growth, from initial data quality assessments to model training and eventual deployment.

داتابريكس تستثمر في ميسترال لدمج نماذج الذكاء الاصطناعي في منصة الذكاء البياني

أنتروبك تكشف عن كلود 3 هايكو: نموذج ذكاء اصطناعي مصمم لتحقيق السرعة والكفاءة الاقتصادية

Most people like

AVCLabs Video Enhancer AI

199.7K

في عالم اليوم الذي يركز على الصور، تعتبر المرئيات عالية الجودة ضرورية لجذب انتباه الجمهور. لحسن الحظ، فإن التقدم في الذكاء الاصطناعي يُحدث ثورة في طريقة تحسين جودة الفيديو والصور. بدءًا من تصحيح الألوان التلقائي إلى تقليل الضوضاء، توفر هذه الأدوات المبتكرة للمحترفين والهواة على حد سواء القدرة على تحويل محتواهم البصري بسهولة. اكتشف كيف يمكن أن يؤدي دمج تكنولوجيا الذكاء الاصطناعي إلى رفع مستوى صورك وخلق نتائج مذهلة تبرز في منافسة اليوم.

معزز الفيديو الذكي AI Image Enhancer

Outlier Database

7.2K

افتتح إمكانيات رحلتك في جيو جيتسو البرازيلية مع تحليلات BJJ المتقدمة المصممة لتحليل المباريات، والتدريب الشخصي، والبحث الفعال عن التقنيات. اكتشف كيف يمكن أن تنقل الرؤى المستندة إلى البيانات أدائك على السجادة إلى مستويات جديدة.

الجيوجيتسو البرازيلية AI Analytics Assistant

EssayGenius

76K

إيساي جينيوس هي منصة مبتكرة تعتمد على الذكاء الاصطناعي تهدف إلى مساعدة المستخدمين في كتابة مقالات عالية الجودة بسرعة وكفاءة. باستخدام تقنية متقدمة، تُبسط عملية الكتابة، مما يمكّنك من إنتاج محتوى مدهش في وقت أقل.

أخرى Writing Assistants

FeelMe AI

44.2K

اكتشف منصة ترفيه بالغين تفاعلية متطورة تُحول الطريقة التي تتفاعل بها مع المحتوى. من خلال دمج ميزات غامرة وتجارب يقودها المستخدمون، نعزز المتعة والرضا بطريقة فريدة. استكشف كيف يعيد نهجنا المبتكر تعريف ترفيه البالغين، مما يجعله أكثر تخصيصًا وجذبًا من أي وقت مضى.

إباحية تفاعلية NSFW

Find AI tools in YBX