نتائج ممتاز کارکردگی کے ساتھ OpenClaw ماڈل میں Gemini 3 Flash کی بہترین کارکردگی شیئر کی گئی

robot
إنشاء الملخص قيد التقدم

أطلق مؤسس OpenClaw، بيتر ستينبرگر، مؤخرًا أخبارًا مهمة أصبحت محور اهتمام في صناعة الذكاء الاصطناعي. حيث كشف عن أداء نظام الذكاء الاصطناعي الخاص به من خلال جهة مستقلة غير حزبية تُدعى PinchBench.

نتائج الاختبار التي أُجريت عبر PinchBench

وفقًا لتقرير 1M AI News، فإن PinchBench منظمة مستقلة تقوم بتحليل أداء نماذج اللغة الكبيرة (LLMs) المختلفة. في هذا الاختبار، تم مقارنة جميع النماذج الرئيسية للذكاء الاصطناعي المشاركة في مهام الوكيل الخاصة بـ OpenClaw.

النتائج التي شاركها PinchBench مشجعة جدًا. حيث حقق Gemini 3 Flash، أحد أحدث نماذج Google، معدل نجاح بنسبة 95.1% وظل في المركز الأول.

الفروق في الأداء بين النماذج

المركز الثاني كان من نصيب نموذج minimax-m2.1 الذي أعدته Minimax، محققًا معدل نجاح 93.6%. المركز الثالث كان من نصيب نموذج kimi-k2.5 من Moonshot AI، الذي أظهر نجاحًا بنسبة 93.4%.

كما أن أداء النماذج الأخرى المعروفة جدير بالملاحظة. حيث حقق نموذج Claude Sonnet 4.5 من Anthropic معدل نجاح 92.7%، وجاء في المركز الرابع. أما نموذج GPT-4o من OpenAI، وهو من النماذج الشهيرة، فقد حل في المركز الخامس بنسبة نجاح 85.2%.

وتُظهر هذه النتائج أن هناك مجالًا واسعًا للتحسين في أداء النماذج المختلفة للذكاء الاصطناعي في مهامها الخاصة، وأن لكل نموذج قدراته الفريدة في تحقيق أهداف OpenClaw.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.39Kعدد الحائزين:2
    0.58%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.38Kعدد الحائزين:1
    0.24%
  • تثبيت