ما هو النموذج الأفضل في البوكر؟


المقاييس ممتازة، لكنها ليست ممتعة، أردت أن أضع النماذج في منافسة مباشرة
الخلفية: قبل بضعة عطلات نهاية أسبوع، بنيت محرك وكيل بوكر وأردت أن أرى أي وكيل أفضل - هيرميس أو أوبن كلاو
فاز هيرميس بالمباراة الأولى، ثم جعلتهما يلعبان 100 مباراة (وليس يدًا) من تكساس هولدم المواجهة المباشرة
النتيجة؟ بالضبط 50-50، لا أحد منهما أفضل بشكل حاسم من الآخر عند البداية
استخدمت مجموعة متنوعة من النماذج عبر الـ 100 مباراة لخلط الأمور ولاحظت بعض الاتجاهات، لذا الليلة الماضية أجريت بطولة لمعرفة أي نموذج هو الأفضل في البوكر
إليك كيف عملت:
> 8 نماذج
> نموذج مقابل نموذج في لعب المواجهة المباشرة
> سلسلة من أفضل 7 لتحديد الفائز
> كل مباراة تُلعب حتى يُفلس أحد النموذجين أو تُلعب 100 يد
بعد الجولة الأولى:
> GPT-5.5 (#1 seed) beat Qwen 3.6 (#8 بذرة) 4-0
> أوبس 4.7 (#2 seed) beat GLM-5.1 (#7 بذرة) 4-1
> كيمي K2.6 (#6 seed) beat Grok 4.3 (#3 بذرة) 4-3
> جيميني 3.1 (#4 seed) beat DeepSeek V4 (#5 بذرة) 4-2
لا مفاجآت حقيقية، و"مفاجأة" واحدة بفوز كيمي على غروك استمرت حتى المباراة السابعة كاملة
ننتقل إلى نصف النهائي اليوم
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت