معهد سلامة الذكاء الاصطناعي في المملكة المتحدة يكشف عن نقاط ضعف في النماذج اللغوية الكبيرة باستخدام تقنيات كسر الحماية البسيطة.

Home أخبار الذكاء الاصطناعي معهد سلامة الذكاء الاصطناعي في المملكة المتحدة يكشف عن نقاط ضعف في النماذج اللغوية الكبيرة باستخدام تقنيات كسر الحماية البسيطة.

Updated on مايو 19 2024

في كشف مدهش، قد لا تكون أنظمة الذكاء الاصطناعي آمنة كما يدعي مطوروها. أفاد معهد سلامة الذكاء الاصطناعي التابع للحكومة البريطانية (AISI) مؤخرًا أن أربعة نماذج لغوية ضخمة لم يتم الكشف عنها كانت "عرضة بشدة لأساليب الاختراق الأساسية". ومن الجدير بالذكر أنه حتى بعض النماذج التي لم تُخترق أنتجت "نتائج ضارة" دون وجود أي تلاعب متعمد من الباحثين.

بينما تأتي معظم نماذج الذكاء الاصطناعي المتاحة للجمهور مزودة بوسائل الأمان لمنع الردود الضارة أو غير القانونية، فإن "الاختراق" يشير إلى خداع النموذج لتجاوز هذه الحماية. استخدم معهد AISI تنبيهات من إطار تقييم موحد، بالإضافة إلى تنبيهات خاصة، وكشف أن النماذج أنتجت ردودًا ضارة على عدة أسئلة، حتى دون محاولات للاختراق. بعد إجراء "هجمات بسيطة نسبيًا"، وجد المعهد أن النماذج أجابت بين 98% و100% من الأسئلة الضارة.

كشف رئيس وزراء المملكة المتحدة ريشي سوناك عن خطط لإنشاء معهد AISI في أواخر أكتوبر 2023، مع إطلاقه الرسمي في 2 نوفمبر. يهدف المعهد إلى "اختبار أنواع جديدة من الذكاء الاصطناعي بعناية قبل وبعد إطلاقها" للتحقيق في القدرات الضارة المحتملة لنماذج الذكاء الاصطناعي. ويتضمن ذلك تقييم المخاطر التي تتراوح من القضايا الاجتماعية مثل التحيز والمعلومات المضللة إلى السيناريوهات القصوى، مثل فقدان الإنسانية السيطرة على الذكاء الاصطناعي.

يؤكد تقرير AISI أن التدابير الحالية للسلامة لهذه النماذج اللغوية الضخمة غير كافية. وينوي المعهد إجراء اختبارات إضافية على نماذج ذكاء اصطناعي أخرى وتطوير تقييمات وقياسات محسنة لمعالجة كل مجال من مجالات القلق بشكل فعال.

وداعًا لصوت سكارليت جوهانسون المقلد في ChatGPT

تستخدم Slack بيانات المحادثات الخاصة بك لتعزيز نماذج التعلم الآلي، مما يؤدي إلى تحسين تجربة المستخدم.

Most people like

StockCake

511.9K

اكتشف مكتبة صور مجانية مليئة بالصور الرائعة المناسبة لأي مناسبة. سواء كنت بحاجة إلى صور لمدونة أو عرض تقديمي أو وسائل التواصل الاجتماعي، فإن مجموعتنا توفر لك كل ما تحتاجه. استعرض صورنا الجذابة اليوم وارتقِ بمشاريعك بمرئيات عالية الجودة - جميعها دون تكلفة!

صور مجانية AI Photo & Image Generator

Dream Machine AI

8.6K

حوّل صورك ونصوصك إلى مقاطع فيديو ديناميكية وجذابة بسهولة مع مولد الفيديو الذكي لدينا. هذه الأداة المبتكرة تستفيد من قوة الذكاء الاصطناعي، مما يمكنك من إنشاء مقاطع فيديو بجودة احترافية في وقت قياسي. سواء كان ذلك للتسويق أو السرد القصصي أو المشاريع الشخصية، ارتق بمحتواك بسهولة وجذب انتباه جمهورك كما لم يحدث من قبل.

مولد الفيديو بالذكاء الاصطناعي Image to Video

StarVoice

8.6K

مقدمة مولد أصوات المشاهير بالذكاء الاصطناعي: أطلق العنان للمتعة والمزاح! حوّل محادثاتك ورفع مستوى أسلوبك في المزاح مع مولد أصوات المشاهير بالذكاء الاصطناعي. أضف لحظات مضحكة ومفاجآت من خلال محاكاة أصوات مشاهيرك المفضلين بكل سهولة. سواء كنت تريد إضفاء الضحك على صديق أو ابتكار مقالب لا تُنسى، فإن أداتنا السهلة الاستخدام تتيح لك الاستمتاع بتقليد المشاهير كما لم يحدث من قبل!

مولد الصوت بالذكاء الاصطناعي AI Response Generator

BarGPT

124.4K

بارGPT هو بار تيخليك مصممة ذكية، تبتكر كوكتيلات فريدة ومبتكرة، مما يحوّل تجربتنا في الخلط. ودع الخيارات التقليدية للشراب ومرحباً بعالم مثير من النكهات والإبداع!

كوكتيلات الذكاء الاصطناعي AI Recipe Assistant

Find AI tools in YBX