أرى تصنيف نماذج الذكاء الاصطناعي الجديدة بقيادة Gemini 3 Flash. وفقًا لمعيار PinchBench، تصدرت Gemini 3 Flash المهام في OpenClaw بنسبة نجاح بلغت 95.1%.



في المركز الثاني والثالث هما minimax-m2.1 (93.6%) و kimi-k2.5 (93.4%). بينما Claude Sonnet 4.5 عند 92.7% و GPT-4o عند 85.2%. هناك فرق واضح بين هذه النماذج.

شارك مدير أمن المعلومات في ماجما 23pads هذه البيانات. أداء نماذج الذكاء الاصطناعي يختلف بشكل كبير في مهام الوكيل. قيادة Gemini واضحة حتى الآن.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت