كيف تستفيد OpenAI وMeta من مقاطع فيديو يوتيوب في تدريب الذكاء الاصطناعي: رؤى حول الاتجاهات الناشئة في الصناعة

Home أخبار الذكاء الاصطناعي كيف تستفيد OpenAI وMeta من مقاطع فيديو يوتيوب في تدريب الذكاء الاصطناعي: رؤى حول الاتجاهات الناشئة في الصناعة

Updated on أبريل 7 2024

مع تقدم تكنولوجيا الذكاء الاصطناعي (AI) بسرعة، أصبحت البيانات محركًا أساسيًا في تطوير نماذج الذكاء الاصطناعي. ومع ذلك، يُسلط تقرير حديث من صحيفة وول ستريت جورنال الضوء على تحديات غير مسبوقة تواجهها شركات الذكاء الاصطناعي في الحصول على بيانات تدريب عالية الجودة. اليوم، تستعرض صحيفة نيويورك تايمز الاستراتيجيات التي تعتمدها هذه الشركات للتغلب على هذه القضية المعقدة، خاصة فيما يتعلق بقوانين حقوق الطبع والنشر.

تمتلك OpenAI، الرائدة في هذا المجال، حاجة ملحة إلى بيانات التدريب. وفقًا للتقارير، قامت الشركة بكتابة نصوص لأكثر من مليون ساعة من مقاطع فيديو يوتيوب لتطوير نموذجها المتقدم GPT-4 باستخدام تقنية تحويل الصوت Whisper. كما قامت OpenAI بتجميع موارد بيانات متنوعة، بما في ذلك الأكواد من GitHub، وقواعد البيانات لتحركات الشطرنج، والمحتوى التعليمي من Quizlet.

هذه النهج أثار جدلًا قانونيًا. بينما تؤكد OpenAI أن استخدام بياناتها يتوافق مع مبادئ الاستخدام العادل، تكشف صحيفة نيويورك تايمز أن رئيس OpenAI، جريج بروكمان، كان متورطًا شخصيًا في عملية جمع البيانات، مما يزيد الأمور تعقيدًا.

في مقابلة مع The Verge، صرح المتحدث باسم OpenAI أن الشركة تنظم مجموعات بيانات فريدة لكل نموذج، بهدف تحسين فهمها للعالم والحفاظ على تنافسية البحث على مستوى عالمي. كما ذكر المتحدث أن OpenAI تستكشف توليد بيانات صناعية لتقليل اعتمادها على مصادر البيانات الخارجية.

أعربت Google عن قلقها بشأن ممارسات OpenAI، حيث أشار متحدث باسمها عبر البريد الإلكتروني إلى أن الشركة لاحظت تقارير غير مؤكدة حول أنشطة OpenAI، مشددًا على أن ملف robots.txt وشروط خدمة Google تمنعان جمع أو تنزيل محتوى يوتيوب بدون إذن.

في مقابلة حديثة، أشار الرئيس التنفيذي ليوتيوب، نيل موهان، إلى أنه رغم عدم وجود دليل مباشر على أن OpenAI استخدمت مقاطع فيديو يوتيوب لتدريب نموذج Sora، فإن مثل هذه الأفعال ستشكل انتهاكًا لشروط خدمة يوتيوب.

في الوقت نفسه، تواجه Meta تحدياتها الخاصة المتعلقة بتوافر البيانات. وفقًا لنيويورك تايمز، بينما تسعى فريق الذكاء الاصطناعي في Meta لمنافسة OpenAI، فإنها تفكر في سيناريوهات تتعلق بالاستخدام غير المصرح به للأعمال المحمية بحقوق الطبع والنشر. لتوسيع مجموعات بياناتها، استعرضت Meta مجموعة واسعة من الكتب والمقالات والشعر والأخبار باللغة الإنجليزية، وناقشت إمكانية مدفوعات لترخيص الكتب أو شراء حقوق مباشرة من الناشرين الكبار.

تؤكد هذه التطورات التحديات القانونية والأخلاقية التي تواجهها صناعة الذكاء الاصطناعي في جمع البيانات واستخدامها. مع تقدم التكنولوجيا، تبرز السؤال الملح: كيف يمكن لنماذج الذكاء الاصطناعي أن تتطور مع احترام حقوق الطبع والنشر؟ من الضروري أن تتعاون شركات الذكاء الاصطناعي والجهات التنظيمية لوضع لوائح أكثر وضوحًا وعدلاً تعزز التطوير الصحي والمستدام لتكنولوجيا الذكاء الاصطناعي.

تستثمر عمالقة وادي السيليكون مليارات الدولارات للتنافس على موارد بيانات تدريب الذكاء الاصطناعي.

حقق ChatGPT Enterprise من OpenAI نموًا بنسبة 300% في عدد المستخدمين، متجاوزًا 600,000 مستخدم خلال ثلاثة أشهر فقط.

Most people like

Flux AI Studio

109.4K

اكتشف منصتنا المدعومة بالذكاء الاصطناعي التي تحول نصك إلى صور رائعة. مع التكنولوجيا المتطورة، يمكنك بسهولة إحياء كلماتك - لإنشاء صور تتناسب مع خيالك. انضم إلى عدد لا يحصى من المستخدمين الذين اكتشفوا إمكانيات تحويل الأفكار إلى رسومات جذابة من خلال أدواتنا المبتكرة.

مولد صور الذكاء الاصطناعي Text to Image

Vanna

49.3K

فانا هي حزمة بايثون مبتكرة مدفوعة بالذكاء الاصطناعي مصممة لأتمتة توليد SQL لقواعد البيانات، لتكون مساعدك الذكي في تحليل البيانات.

الذكاء الاصطناعي AI SQL Query Builder

Morgen

141.3K

Morgen هي منصة شاملة مصممة لتبسيط إدارة المواعيد وتنظيم المهام وجدولتها، ومتاحة على جميع أجهزتك. مثالية للأفراد والفرق على حد سواء، تعزز Morgen الإنتاجية من خلال مزامنة مهامك ومواعيدك لتجربة تخطيط سلسة.

تقويم AI Scheduling

Undressing AI

333.9K

إنشاء صور عارية عميقة باستخدام تقنية الذكاء الاصطناعي المتقدمة.

الذكاء الاصطناعي NSFW

Find AI tools in YBX