اليوم، كشفت شركة Pindrop، الرائدة في مجال أمان الصوت، والتحقق من الهوية، واكتشاف الاحتيال، عن أداة Pulse Inspect—أداة ويب مصممة لكشف الكلام الذي تم إنشاؤه بواسطة الذكاء الاصطناعي في ملفات الصوت والفيديو الرقمية بدقة مذهلة تصل إلى 99%.
تتوفر Pulse Inspect حاليًا في إطار معاينة كجزء من مجموعة Pulse الخاصة بـ Pindrop، مما يتيح الكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي بغض النظر عن الأداة أو النموذج المستخدم في إنشائه.
تتميز هذه الأداة الجديدة بكونها مبتكرة عن ممارسات الصناعة السائدة، حيث تقتصر تصنيفات مقدمي خدمات الذكاء الاصطناعي عادةً على الكشف عن المحتوى المُنتَج بواسطة منصاتهم الخاصة. وتقدم Pindrop Pulse Inspect من خلال اشتراك سنوي، تستهدف به المؤسسات التي تحتاج إلى مواجهة مخاطر "ديب فيك" الصوتي على نطاق واسع. وذكر الرئيس التنفيذي فيجاي بالاسوبارمانيان أنه، بناءً على طلب السوق، قد يقدمون مستويات أسعار أكثر ملاءمة بعدد محدود من الفحوصات للمستهلكين الأفراد.
مواجهة زيادة "ديب فيك" الصوتي
على الرغم من أن "ديب فيك" موجودة منذ سنوات، إلا أن انتشار الذكاء الاصطناعي القائم على النصوص قد زاد من وضوحها على الإنترنت. فقد تم استخدام أدوات من شركات مثل Microsoft وElevenLabs لإنشاء محتوى صوتي وفيديو مزيف يقلد المشاهير، والشخصيات التجارية، والسياسيين، مما أدى إلى انتشار المعلومات المضللة والأضرار للسمعة.
تفيد التقارير الداخلية لشركة Pindrop أن أكثر من 12 مليون بالغ أمريكي يعلمون عن شخص واحد على الأقل كان ضحية لإنشاء "ديب فيك" غير متفق عليه. تستغل هذه النسخ، التي تتضمن الصور والفيديو والصوت، خاصية الانتشار السريع عبر وسائل التواصل الاجتماعي.
لمواجهة هذه القضية الملحة، أطلقت Pindrop مجموعة Pulse في وقت سابق من هذا العام، مع التركيز في الحل الأول على كشف مكالمات "ديب فيك" إلى مراكز الاتصال. من خلال Pulse Inspect، تعمل Pindrop على توسيع قدراتها، مما يمكّن المؤسسات من تحليل أي ملف صوتي أو فيديو للبحث عن العيوب الاصطناعية.
تحليل صوتي فعال
تعمل Pulse Inspect كأداة ويب بسيطة، تسمح للمستخدمين من المؤسسات بتحميل الملفات التي قد تكون مشبوهة لتحليلها على الفور. في السابق، كانت عملية تحديد العيوب الاصطناعية تتطلب عملاً جنائيًا كثيفًا. الآن، تعالج الأداة الملفات في ثوانٍ، موفرة "درجة ديب فيك" وتحديد الأجزاء التي تحتوي على كلام تم إنشاؤه بواسطة الذكاء الاصطناعي.
هذا التحليل السريع يمكّن المؤسسات من مواجهة المعلومات المضللة بشكل استباقي، والحفاظ على نزاهة العلامة التجارية.
تدريب كشف متقدم
تم تدريب نموذج الكشف الخاص بشركة Pindrop على أكثر من 350 أداة لإنشاء "ديب فيك" و20 مليون نطق فريد عبر أكثر من 40 لغة، محققًا دقة تصل إلى 99% في كشف الصوت المزيف وفقًا للتقييمات الداخلية لمجموعة بيانات تضم حوالي 200,000 عينة. يقوم النموذج بتقييم ملفات الوسائط بحثًا عن العيوب الاصطناعية كل أربع ثوانٍ، مما يضمن تصنيفًا دقيقًا حتى في البيئات المختلطة للوسائط.
وأوضح بالاسوبارمانيان: "تستخدم تقنية Pindrop تقدمات في الشبكات العصبية العميقة (DNN) وتحليل الطيف الزمني المعقد للكشف عن العيوب الاصطناعية من خلال طرق متنوعة."
قدرات كشف شاملة
تتمثل قوة Pulse Inspect في قدرتها على التعرف على "ديب فيك" دون قيود خاصة بمقدمي الخدمة. وأشار بالاسوبارمانيان إلى أن العديد من "ديب فيك" الصوتية السائدة تنبع من أدوات مفتوحة المصدر بدلاً من التجارية. تعد أداة الكشف الشاملة من Pindrop ضرورية لتحديد الصوت الاصطناعي عبر أنظمة إنشاء متعددة.
ومع ذلك، من الضروري الإقرار بأن الأداة قد تواجه صعوبة مع الملفات التي تحتوي على أقل من ثانيتين من الكلام أو الضوضاء الخلفية المفرطة. يعمل الفريق حاليًا على تحسين دقة الكشف ومعالجة هذه القيود.
وترتكز Pindrop حاليًا على استهداف Pulse Inspect لمجموعة متنوعة من المؤسسات، بما في ذلك شركات الإعلام، والمنظمات غير الربحية، والهيئات الحكومية، وشركات إدارة المشاهير، والشركات القانونية، ومنصات التواصل الاجتماعي. بينما لم يكشف بالاسوبارمانيان عن أرقام العملاء المحددة، أكد أن العديد من الشركاء يستخدمون المنتج من خلال اشتراكات سنوية قائمة على الحجم، بما في ذلك TrueMedia.org، التي تساعد المستخدمين على تحديد "ديب فيك" في سياقات انتخابية حساسة.
بالإضافة إلى التحميلات اليدوية، يمكن دمج Pulse Inspect في سير العمل الجنائي المخصصة عبر واجهة برمجة التطبيقات (API)، مما يسهل حالات الاستخدام بالجملة مثل الإبلاغ عن المحتويات الضارة الناتجة عن الذكاء الاصطناعي وإزالتها على وسائل التواصل الاجتماعي.
وتخطط Pindrop في المستقبل لتعزيز مجموعة Pulse من خلال تحسين قابلية تفسير أدواتها، مع نية تقديم ميزات تتبع مصدر إنشاء "ديب فيك" بينما توسع الدعم لموديلات إضافية.