اكتشف نموذج الكشف الصوتي المتقدم من Resemble AI، Detect-2B، الذي يحقق دقة تصل إلى 94% في تحليل الذكاء الاصطناعي.

شركة ريزيمبل AI تطلق نموذجاً متطوراً للكشف عن التزييف العميق

أعلنت شركة ريزيمبل AI عن إطلاق Detect-2B، الجيل القادم من نموذجها للكشف عن التزييف العميق، والذي يتمتع بدقة مذهلة تصل إلى حوالي 94%.

تصميم مبتكر للنموذج

يستخدم Detect-2B سلسلة من النماذج الفرعية المدربة مسبقاً، التي تم تحسينها من خلال التعديل الدقيق، لتحليل مقاطع الصوت والتعرف على ما إذا كانت قد تم إنتاجها بواسطة الذكاء الاصطناعي. وذكرت الشركة في منشور على مدونتها، "بناءً على الأساس المتين لنموذج Detect الأصلي، يمثل DETECT-2B تقدماً هاماً في تصميم النموذج وبيانات التدريب والأداء العام. النتيجة هي أداة موثوقة للغاية للكشف عن التزييف العميق، تقدم دقة استثنائية ضد مجموعة واسعة من المقاطع الصوتية الحقيقية والمزيفة".

التركيز على الشوائب الصوتية

وفقاً لريزيمبل، يتضمن Detect-2B نموذج تمثيل صوتي ثابت مع وحدة تكييف موضوعة بشكل استراتيجي داخل طبقاته الرئيسية. هذه الوحدة توجّه انتباه النموذج نحو الشوائب—الأصوات الدقيقة التي تميز الصوت الحقيقي عن الاصطناعي. غالباً ما يبدو الصوت المولد بواسطة الذكاء الاصطناعي "نظيفاً جداً"، ولكن Detect-2B يستطيع تقدير مقدار المقطع الذي تم إنتاجه بواسطة الذكاء الاصطناعي دون الحاجة إلى إعادة التدريب مع كل مدخل جديد. تمت تدريب النماذج الفرعية على مجموعات بيانات واسعة لتعزيز الموثوقية.

عملية توقع مبسطة

يجمع Detect-2B درجات التوقع ويقارنها مقابل "عتبة مضبوطة بعناية" لتحديد مدى صحة التسجيلات. تبرز ريزيمبل أن الباحثين صمموا Detect-2B ليكون فعالاً في التدريب، مما يتطلب قدرة حاسوبية أقل.

بنية نموذج عشوائية

تستخدم بنية النموذج Mamba-SSM أو نماذج الفضاءات الحالة، التي لا تعتمد على بيانات ثابتة أو أنماط متكررة. بدلاً من ذلك، تستخدم نموذجاً عشوائياً، مما يسمح لها بالتكيف بفاعلية مع ظروف الصوت المختلفة. تتفوق هذه البنية في التقاط ديناميكيات الصوت، مما يضمن أداءً موثوقاً حتى في التسجيلات ذات الجودة المنخفضة.

أداء متعدد اللغات قوي

لتقييم قدراتها، خضعت Detect-2B لمجموعة اختبار متنوعة، تشمل متحدثين غير معروفين، وأصوات مزيفة، والعديد من اللغات. وقد تمكن النموذج من التعرف بدقة على الصوت المزيف عبر ست لغات، محققاً دقة تصل إلى 93%.

الدمج وإمكانية الوصول

سيتوفر Detect-2B عبر واجهة برمجة التطبيقات API، مما يتيح تكاملاً سلساً في مختلف التطبيقات. يأتي هذا الإطلاق بعد طرح ريزيمبل لمنصة صوت الذكاء الاصطناعي الخاصة بها، Rapid Voice Cloning، في أبريل.

أهمية الكشف عن التزييف العميق في السياق الحالي

مع اقتراب انتخابات الرئاسة الأمريكية 2024، تزداد أهمية التعرف على الأصوات والفيديوهات المولدة بواسطة الذكاء الاصطناعي. يثير احتمال استخدام أصوات الذكاء الاصطناعي لتضليل الناخبين ونشر المعلومات المضللة مخاوف كبيرة، خاصةً فيما يتعلق بالتزييف العميق للمعاني العامة. إن سوء التمثيل في وسائل الإعلام قد إضعاف الثقة الاستهلاكية، مما يجعل أدوات مثل Detect-2B حيوية للتحقق من المحتوى قبل وصوله للجمهور.

البحث والتطوير المستمر

تعترف ريزيمبل أن رحلة تكنولوجيا الكشف قد بدأت للتو. وذكرت الشركة، "مع تقدم قدرات الذكاء الاصطناعي التوليدي، يجب أن تتقدم أيضاً تقنيات الكشف لدينا. لدينا عدة اتجاهات بحثية مثيرة مخطط لها لتعزيز DETECT-2B، مع التركيز على تعلم التمثيل وبنى النماذج المتقدمة وتوسيع البيانات".

Most people like

Find AI tools in YBX