Claude Opus 4.6 最近 يبدو أنه أصبح أقل ذكاءً حقًا……


الأسبوع الماضي في اختبار الأداء الوهمي على BridgeBench، كان لا يزال يحتل المركز الثاني بثقة، بنسبة دقة 83.3%
النتيجة في اختبار 12 أبريل أعيدت، وانخفض مباشرة إلى المركز العاشر، بنسبة دقة 68.3% فقط، وزادت نسبة الوهم إلى 98%
عند مقارنة الصور قبل وبعد، الفرق واضح جدًا
الكثير من الناس الذين يستخدمونه مؤخرًا في كتابة الشفرات، أو إجراء الاستنتاجات، يشعرون أيضًا بأنه أصبح أبطأ، ينسى الأوامر بسرعة، ويكثر من الكلام غير المنطقي
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت