Mô hình nào là tốt nhất trong poker?


Chỉ số chuẩn rất tuyệt, nhưng chúng không vui vẻ, tôi muốn đưa các mô hình vào cuộc thi đối đầu trực tiếp
Bối cảnh: cách đây vài cuối tuần, tôi đã xây dựng một engine poker cho agent và muốn xem agent nào tốt hơn - Hermes hay OpenClaw
Hermes thắng trận đầu tiên, sau đó tôi cho họ chơi 100 trận (không phải ván) Texas Hold'em đối đầu trực tiếp
Kết quả? Chính xác 50-50, không ai thắng rõ ràng ngay từ ban đầu
Tôi đã sử dụng nhiều mô hình khác nhau trong 100 trận để thay đổi và nhận thấy một số xu hướng, vì vậy tối qua tôi đã tổ chức một giải đấu để xem MÔ HÌNH nào tốt nhất trong poker
Dưới đây là cách nó hoạt động:
> 8 mô hình
> mô hình đối đầu mô hình trong chơi đối đầu trực tiếp
> loạt trận best-of-7 để xác định người chiến thắng
> mỗi trận đấu diễn ra cho đến khi một mô hình phá sản hoặc 100 ván đã chơi
Sau vòng đầu tiên:
> GPT-5.5 (#1 seed) beat Qwen 3.6 (#8 seed) 4-0
> Opus 4.7 (#2 seed) beat GLM-5.1 (#7 seed) 4-1
> Kimi K2.6 (#6 seed) beat Grok 4.3 (#3 seed) 4-3
> Gemini 3.1 (#4 seed) beat DeepSeek V4 (#5 seed) 4-2
Không có gì quá bất ngờ, và trận "bất ngờ" duy nhất khi Kimi thắng Grok đã kéo dài đủ 7 trận
Chuyển sang vòng bán kết hôm nay
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim