إطلاق العنان لـ GPT-4: أداء مذهل في تقييم العيون وتوصيات الخبراء للتطبيق الحذر

أظهرت دراسة حديثة من كلية الطب في جامعة كامبريدج أن نموذج GPT-4 من OpenAI يؤكد أداءً مRemarkable في التقييمات العينية، حيث يقترب من كفاءة الأطباء المتخصصين. وقد جذبت هذه النتيجة الرائعة اهتمامًا كبيرًا من المجتمعين الطبي والتكنولوجي.

نُشرت الدراسة في مجلة PLOS Digital Health، حيث قيمت GPT-4 وسلفه GPT-3.5، بالإضافة إلى Google PaLM 2 وMeta LLaMA، باستخدام اختبار شامل للمعرفة العينية. تضمن الاختبار 87 سؤالاً متعدد الخيارات تغطي موضوعات مثل الحساسية للضوء والآفات المختلفة، بمستوى صعوبة يعكس الكتب الدراسية في طب العيون. كما خضع للاختبار خمسة خبراء في طب العيون وثلاثة أطباء مقيمين واثنان من الأطباء المبتدئين. تجدر الإشارة إلى أن هذه الأسئلة كانت جديدة تمامًا بالنسبة لنماذج اللغة الكبيرة.

كانت النتائج مدهشة: حيث أجاب GPT-4 على 60 سؤالاً بشكل صحيح، متفوقًا على الأطباء المقيمين والمبتدئين. وعلى الرغم من أنه سجل أقل بقليل من المتوسط 66.4 الذي حققه خبراء طب العيون، إلا أن النتائج تسلط الضوء على إمكانياته الكبيرة في التقييمات العينية. بينما حققت النماذج الأخرى، مثل PaLM 2 وGPT-3.5 وLLaMA، درجات 49 و42 و28 على التوالي، وهو ما يقل عن متوسط أطباء المبتدئين.

بينما تظهر هذه النتائج التطبيقات الواعدة لنماذج اللغة الكبيرة في الرعاية الصحية، يحذر الباحثون من المبالغة في تقدير موثوقيتها. ويشيرون إلى أن العدد المحدود من الأسئلة، لا سيما في بعض الفئات، قد يؤثر على النتائج. بالإضافة إلى ذلك، يمكن لنماذج اللغة الكبيرة أن تنتج أحيانًا "هلاوس"، مما يؤدي إلى توليد معلومات غير ذات صلة أو غير صحيحة، مما يشكل مخاطر جسيمة في السياقات الطبية. على سبيل المثال، يمكن أن تؤدي التشخيصات الخاطئة لإعتام عدسة العين أو السرطان إلى عواقب وخيمة على المرضى.

يؤكد الباحثون أنه على الرغم من النتائج الإيجابية الأولية لنماذج اللغة الكبيرة في التقييمات العينية، فإن الحذر ضروري في التطبيقات الواقعية. ينبغي أن تركز الجهود المستقبلية على تعزيز دقة وموثوقية هذه النماذج لضمان قدرتها على خدمة المجال الطبي بشكل آمن وفعال.

توفر هذه الدراسة وجهة نظر جديدة حول دور نماذج اللغة الكبيرة في الرعاية الصحية، بينما تؤكد على أهمية الوعي بالمخاطر والقيود التي قد تواجهها أثناء السعي نحو التقدم التكنولوجي. ومع استمرار تطور تكنولوجيا نماذج اللغة الكبيرة، نتطلع إلى رؤى جديدة حول كيفية تأثيرها إيجابيًا على قطاع الرعاية الصحية.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles