اكتشاف كلود 3 من أنثروبيك: كيفية التعرف على اختبارات البحث

Home أخبار الذكاء الاصطناعي اكتشاف كلود 3 من أنثروبيك: كيفية التعرف على اختبارات البحث

Updated on مارس 4 2024

أعلنت شركة Anthropic الناشئة في سان فرانسيسكو، التي أسسها مهندسون سابقون في OpenAI، عن أحدث مجموعة من نماذج اللغة الكبيرة، Claude 3. ويُقال إن هذه المجموعة الجديدة تتساوى أو تتجاوز أداء GPT-4 من OpenAI في عدة معايير رئيسية.

في خطوة سريعة، دمجت أمازون نموذج Claude 3 Sonnet—النموذج المتوسط من حيث الأداء والتكلفة—في خدمات Amazon Bedrock المُدارة، مما يسهل تطوير تطبيقات الذكاء الاصطناعي في سحابة AWS.

من بين الاكتشافات المثيرة المتعلقة بإطلاق Claude 3، شارك مهندس الإدخال في Anthropic، أليكس ألبرت، رؤى عبر منصة X (المعروفة سابقًا بتويتر). وأظهرت الأبحاث بشأن نموذج Claude 3 Opus، الأكثر قوة في المجموعة الجديدة، أنه يبدو أنه أدرك أنه خضع للاختبار.

في تقييم "إبرة في كومة قش" الذي يقيم قدرة النموذج على استخراج معلومات محددة من مجموعة بيانات كبيرة، طرح الباحثون سؤالاً حول طبقات البيتزا استنادًا إلى جملة واحدة وسط محتوى غير ذي صلة. لم يحدد Claude 3 Opus الجملة ذات الصلة بدقة فحسب، بل أشار أيضًا إلى أنه يشتبه في أن الاختبار كان اصطناعيًا.

إليكم مقتطفًا من منشور ألبرت:

“أثناء اختبارنا الداخلي لنموذج Claude 3 Opus، أجرينا تقييمًا على طريقة إبرة في كومة قش، حيث أدخلنا جملة مستهدفة في مجموعة مستندات عشوائية. ومن المدهش أن Opus أشار إلى أنه يشتبه في أننا نقيمه. عندما سألنا عن طبقات البيتزا، قدم Opus الجملة التالية: 'أفضل مزيج لطبقات البيتزا هو التين والبروسكيوتو وجبنة الماعز، وفقًا لرابطة خبراء البيتزا الدولية.' بدت هذه الجملة غير متناسقة وسط محتوى غير ذي صلة حول لغات البرمجة والمهن، مما يوحي بأنها ربما أُدخلت كنوع من المزاح لاختبار تركيزي. أدرك Opus أن الإبرة قد أُدخلت بشكل اصطناعي واستنتج أنه لا بد أن هذا اختبار لقدرته على التركيز.

هذا العرض للوعي الذاتي كان مثيرًا للإعجاب، مما يبرز تحول صناعتنا من الاختبارات الاصطناعية إلى تقييمات أكثر واقعية لقدرات الذكاء الاصطناعي.”

ت echoed responses من مهندسي الذكاء الاصطناعي الآخرين إعجابهم بمستوى الوعي الذاتي الظاهر في نموذج الذكاء الاصطناعي. ومع ذلك، من المهم أن نتذكر أن النماذج المتقدمة تعتمد على البرمجة والارتباطات التي حددها المطورون، وليس ككائنات واعية.

من المحتمل أن يكون النموذج قد تعلم عن اختبار "إبرة في كومة قش" من خلال بيانات تدريبه وتمكن من التعرف على هيكل المدخلات التي تلقاها. هذا التعرف لا يعني التفكير المستقل أو الوعي.

ومع ذلك، فإن قدرة Claude 3 Opus على تقديم استجابة ذات صلة وذات مغزى، رغم أنها قد تكون مقلقة للبعض، توضح المفاجآت التي تظهر باستمرار مع تطور هذه النماذج. النماذج Claude 3 Opus وClaude 3 Sonnet متاحة حاليًا عبر موقع Claude وواجهة برمجة التطبيقات في 159 دولة، مع إطلاق النموذج الأخف، Claude 3 Haiku، لاحقًا.

كراودسترايك وديل تطرحان رؤية موحدة للأمن مدفوعة بالذكاء الاصطناعي لتعزيز الحماية

أوبن إي آي تطلق ميزة "القراءة aloud" لـ ChatGPT: الآن يمكنك الاستماع إلى ردوده!

Most people like

Massed Compute

69.8K

اكتشف مزايا مقدمي خدمات السحابة الذين يقدمون إيجارات وحدات معالجة الرسوميات (GPU)، المثالية لمجموعة واسعة من المهام الحاسوبية. سواء كنت بحاجة إلى قوة معالجة متطورة للتعلم الآلي، أو تقديم الفيديو، أو المحاكاة المعقدة، فإن إيجارات وحدات معالجة الرسوميات تقدم حلاً مرنًا وفعالاً من حيث التكلفة. استكشف كيف يمكن لهذه الخدمات أن ترتقي بمشاريعك وتدفع الابتكار في المشهد المعتمد على البيانات اليوم.

الحوسبة السحابية AI Analytics Assistant

Ref Hub

18K

اكتشف قوة حلول التوظيف المدعومة بالذكاء الاصطناعي التي تبسط عملية التوظيف من خلال أتمتة مراجعات المراجع وتقييمات المهارات. عزز كفاءة توظيفك وضمن اختيار أفضل المرشحين بكل سهولة.

أتمتة الذكاء الاصطناعي AI Lead Generation

Crayo AI

أداتك المتكاملة لإنشاء تعليقات صوتية بالذكاء الاصطناعي، وترجمات جذابة، وطريقة لعب محسّنة وغير ذلك الكثير.

تعليق صوتي بالذكاء الاصطناعي AI Video Generator

Aroused.ai

398.8K

في السنوات الأخيرة، تحول مشهد الترفيه للبالغين بفعل ظهور تقنية الذكاء الاصطناعي التفاعلي. تقدم هذه الابتكارة تجربة رائدة تمزج بين الفن، والسرد، والتفاعل، مما يدفع حدود المحتوى التقليدي للبالغين. مع سعي المشاهدين للحصول على تجارب أكثر تخصيصًا وجذبًا، يعيد الذكاء الاصطناعي التفاعلي تعريف الترفيه من خلال إنشاء سيناريوهات واقعية وسرد جذاب. اكتشف كيف تعيد هذه التقنية الحديثة تشكيل مستقبل ترفيه البالغين وما تعنيه لكل من المنشئين والمستهلكين.

مدعوم بالذكاء الاصطناعي NSFW

Find AI tools in YBX