أفادت التقارير أن ByteDance، الشركة الأم لتيك توك، تنتهك شروط خدمة OpenAI باستخدام تقنيتها لتطوير نماذج لغوية كبيرة تنافس. وفقًا لموقع The Verge، تستفيد ByteDance من واجهة برمجة التطبيقات (API) الخاصة بـ OpenAI لجمع البيانات لتطوير نموذجها الأساسي المعروف حاليًا باسم مشروع Seed. بفضل تاريخها الطويل في الابتكار في مجال الذكاء الاصطناعي التوليدي، يركز باحثو ByteDance على نماذج الجيل الثلاثي المتطورة.
تحظر سياسات OpenAI صراحة استخدام نواتج مثل GPT-4 لإنشاء أنظمة منافسة. ومع ذلك، يُزعم أن ByteDance تحصل على الوصول إلى تقنية OpenAI عبر Microsoft، التي تفرض أيضًا قيودًا مماثلة، وقد كانت تستخدم واجهة البرمجة الخاصة بها بشكل مفرط. تشير التقارير إلى أن هذه الواجهة كانت أساسية في مراحل تطوير مشروع Seed، بما في ذلك تدريب النماذج وتقييمها.
وفقًا لمعلومات حصل عليها The Verge، أظهرت مناقشات بين الموظفين على منصة Lark، الخاصة بـ ByteDance، جهودًا لـ "تبييض" الأدلة على الاستخدام المزعوم لتقنية OpenAI. ويُزعم أن مطوري الشركة، الذين يتواجدون بشكل أساسي في الصين، قد أخفوا استخدامهم لواجهة برمجة تطبيقات OpenAI من خلال تقنيات إزالة حساسية البيانات، التي عادةً ما تستخدم لحماية المعلومات التجارية أو الشخصية الحساسة.
ردًا على هذه الاتهامات، أكدت OpenAI أن وصول ByteDance إلى حساب ChatGPT الخاص بها قد تم تعليقه أثناء إجراء التحقيق. وأكد متحدث باسم ByteDance التزام الشركة باتباع إرشادات استخدام OpenAI، مشيرًا إلى أنهم يستخدمون GPT لتعزيز المنتجات والميزات في الأسواق خارج الصين، بينما يعمل نموذجهم الخاص على تشغيل Doubao، الذي يقتصر استخدامه على الصين.
Doubao هو نظام الذكاء الاصطناعي التفاعلي الخاص بـ ByteDance، الذي يسهل تفاعلات المستخدمين من خلال الصور والنصوص. زعم المتحدث أن مجموعة محدودة من المهندسين قد استخدمت سابقًا واجهة برمجة تطبيقات OpenAI "لنموذج تجريبي داخلي صغير لم يتم طرحه أبدًا". وذكرت التقارير أن هذه الممارسة توقفت في أبريل، مع وضع بروتوكولات داخلية جديدة لضمان عدم استخدام النصوص التي تم إنشاؤها بواسطة نماذج GPT في مجموعات بيانات التدريب الخاصة بنماذج ByteDance.
علاوة على ذلك، أفادت ByteDance بأن فريقها الهندسي يستخدم الآن واجهة GPT في سعة محدودة خلال عمليات التقييم والاختبار، مثل قياس الدرجات. وقد نفذت الشركة تدابير لضمان الالتزام، بما في ذلك إجراء عيّنات جماعية ومقارنة تشابه بياناتها المعلّمة مع نواتج OpenAI لتقليل مخاطر الاستخدام غير المناسب من قبل المعلقين على البيانات.
في ظل ارتفاع شعبية ChatGPT، دخلت شركات التكنولوجيا الكبرى في الصين، بما في ذلك ByteDance وBaidu وAlibaba، في سباق لتطوير نماذج لغوية كبيرة خاصة بها. مؤخرًا، كشفت الصين عن حاسوب خارق جديد مصمم لتعزيز الجهود المحلية في تدريب نماذج الذكاء الاصطناعي، مما يسلط الضوء على المشهد التنافسي في قطاع الذكاء الاصطناعي.