أحدث دراسة في هارفارد: استخدام نماذج اللغة الكبيرة للذكاء الاصطناعي في التشخيص الطبي، 80٪ من التشخيصات الأولية خاطئة

robot
إنشاء الملخص قيد التقدم

موقع مارس فاينانس أخبار 15 أبريل: قام فريق بحثي من كلية هارفارد الطبية في الولايات المتحدة بتقييم قدرة التشخيص لنحو عشرين من نماذج اللغة الكبيرة المتقدمة للذكاء الاصطناعي (LLM)، بما في ذلك ChatGPT و DeepSeek و Gemini و Claude. أظهرت النتائج أن معدل الخطأ في إجراء “التشخيص التفريقي” (تحديد الأمراض المحتملة) استنادًا إلى الأعراض والعلامات الأولية للمريض يصل إلى 80%. وأظهرت الدراسة أيضًا أنه بعد تقديم المريض لمزيد من نتائج الفحوصات، يمكن للنماذج الكبيرة تقليل معدل فشل “التشخيص النهائي” إلى حوالي 40%. وأشار الباحثون إلى أن هذا يعني أن روبوتات الدردشة الذكية بحاجة إلى معلومات كاملة من المريض لكي تقدم تشخيصًا أكثر دقة للأمراض، وأن النتائج التي تقدمها الذكاء الاصطناعي غير موثوقة عندما لا يتمكن المريض من تقديم معلومات كاملة عن الفحوصات الصحية. كما أكد الباحثون أن “الذكاء الاصطناعي لم يصل بعد إلى مستوى يمكنه من اتخاذ قرارات تشخيصية للمرضى دون تدخل من متخصصين في الرعاية الصحية.” (الاقتصاد الأول)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت