Model apa yang terbaik di poker?


Tolok ukur bagus, tapi mereka tidak menyenangkan, saya ingin menempatkan model dalam kompetisi head-to-head
Latar belakang: beberapa akhir pekan lalu saya membangun mesin agen poker dan ingin melihat agen mana yang lebih baik - Hermes atau OpenClaw
Hermes memenangkan pertandingan pertama, lalu saya membuat mereka bermain 100 pertandingan (bukan tangan) Texas Hold'em head-up
Hasilnya? Tepat 50-50, keduanya tidak secara decisif lebih baik dari awal
Saya menggunakan berbagai model selama 100 pertandingan untuk variasi dan memperhatikan beberapa tren, jadi tadi malam saya menjalankan turnamen untuk melihat MODEL mana yang terbaik di poker
Begini caranya:
> 8 model
> model vs model dalam permainan head-up
> seri terbaik dari 7 untuk menentukan pemenang
> setiap pertandingan dimainkan sampai salah satu model bangkrut atau 100 tangan dimainkan
Setelah babak pertama:
> GPT-5.5 (#1 seed) beat Qwen 3.6 (#8 seed) 4-0
> Opus 4.7 (#2 seed) beat GLM-5.1 (#7 seed) 4-1
> Kimi K2.6 (#6 seed) beat Grok 4.3 (#3 seed) 4-3
> Gemini 3.1 (#4 seed) beat DeepSeek V4 (#5 seed) 4-2
Tidak ada kejutan besar, dan satu "kejutan" dengan Kimi mengalahkan Grok berlangsung hingga 7 pertandingan penuh
Menuju semifinal hari ini
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan