أطلقت Arize AI، خدمة الرصد، منتجًا جديدًا يهدف إلى مساعدة الشركات في تحديد متى تؤدي بيانات الإرشادات إلى أخطاء أو ظواهر غير صحيحة في نماذج اللغة الكبيرة (LLMs). هذه الأداة، المصممة لمهندسي الذكاء الاصطناعي، توفر رؤى حيوية ضرورية لتصحيح الأخطاء في الأنظمة المعقدة، وعادة ما تعزل المشاكل المشتقة من بضع أسطر من التعليمات البرمجية.
كما أوضح جايسون لوبيتيكي، المؤسس المشارك والرئيس التنفيذي لشركة Arize، "نحن جميعًا مهندسو إرشادات — لقد صممنا إرشاداتنا الخاصة. تستخدم العديد من التطبيقات إرشادات قالبية، مما يسمح بتطبيقها بشكل متكرر على مجموعات بيانات متنوعة، مما يسهل الحصول على إجابات أفضل لاستفسارات المستخدم. ومع ذلك، تعتمد هذه القوالب على متغيرات الإرشادات المستمدة من نظامك، وحتى الاختلافات الطفيفة في البيانات يمكن أن تؤدي إلى ظواهر غير صحيحة أو أخطاء في نواتج LLM."
يُعد رصد متغيرات الإرشادات أمرًا ضروريًا، خاصة في سياق خدمة العملاء المعتمدة على الذكاء الاصطناعي والدردشة، حيث يمكن أن تؤدي المعلومات غير الصحيحة إلى الإضرار بسمعة العلامة التجارية. بينما قد يبسط إدارة LLM واحد رصد العملية، غالبًا ما تتبنى الشركات نماذج متعددة من مزودين مثل OpenAI وGoogle وMeta وAnthropic وMistral، مما يجعل هذه المتابعة أمرًا حيويًا.
ويشير لوبيتيكي إلى أن المعلومات الخاطئة هي السبب الرئيسي للظواهر غير الصحيحة. ويرتبط تحديد مصدر هذه الأخطاء—سواء كانت البيانات المدخلة إلى النموذج، أو قالب الإرشادات المختار، أو عوامل أخرى—بضرورة الإصلاح الفعال للأنظمة.
فهم التقلبات أمر حيوي أيضًا، حيث يشير إلى نطاق المخرجات المحتملة من نماذج الذكاء الاصطناعي المتأثرة بتعديلات بسيطة أو مدخلات بيانات خاطئة. "عملية اتخاذ القرار ليست مجرد سيناريو مدخلات ومخرجات فردية"، أوضح لوبيتيكي. "غالبًا ما تغذي مخرجات الذكاء الاصطناعي قرارات الذكاء الاصطناعي التالية، مما يخلق شبكة معقدة حيث يمكن أن تتصاعد الاختلافات إلى مشاكل كبيرة."
لمعالجة هذه التحديات، تقوم Arize بتطوير أدوات خصيصًا لمهندسي الذكاء الاصطناعي المهرة في استخدام LLMs المتقدمة لبناء أنظمة ذكاء اصطناعي معقدة. "تحتاج هذه الفرق إلى أدوات قوية لتعزيز ذكاء تطبيقاتهم. ستصبح وظيفة مهندس الذكاء الاصطناعي شائعة في السنوات القادمة"، يقول لوبيتيكي.
يطمح لوبيتيكي أن تصبح Arize "DataDog للذكاء الاصطناعي"، مما يضعها كمنافس لعملاق مراقبة السحاب، الذي بدأ يتجه إلى مراقبة الذكاء الاصطناعي، بما في ذلك دعم نماذج OpenAI مثل GPT-4. ومع ذلك، يعتقد أن Arize لديها ميزة: "على عكس DataDog، وُلدنا في مجال الذكاء الاصطناعي. وتيرة الابتكار سريعة، وهم لا يزالون يطورون منتجاتهم في هذا المجال."
يؤكد على أهمية تقديم حلول فعالة للذكاء الاصطناعي: "بينما تسعى الشركات إلى نشر الأنظمة، غالبًا ما تختبر سيناريوهات محدودة فقط. تصبح التغيرات المحتملة والمشاكل واضحة جدًا بمجرد تشغيل هذه الأنظمة في العالم الحقيقي، مما يؤدي إلى العديد من التحديات غير المتوقعة. لقد وصلت الحاجة إلى أدوات تصحيح الأخطاء الفعالة إلى نقطة حرجة، وتبدأ الشركات في إدراك عدد الأشياء التي يمكن أن تسير على نحو خاطئ."