Con đường của Ant với mô hình suy nghĩ hàng nghìn tỷ tham số Ring-2.6-1T: PinchBench đạt điểm 87.60, vượt GPT-5.4

Theo giám sát Beating, nhóm mô hình lớn Belling của Ant Group đã ra mắt mô hình suy nghĩ flagship với hàng nghìn tỷ tham số Ring-2.6-1T (tham số kích hoạt 630 tỷ). Mô hình này được thiết kế đặc biệt cho các nhiệm vụ phức tạp và môi trường sản xuất, với cơ chế mới chính là “độ mạnh suy nghĩ động”, hệ thống có thể linh hoạt cân bằng giữa độ sâu nhận thức, chi phí Token và tốc độ thực thi.

Dựa trên các yêu cầu tải tính toán khác nhau, mô hình cung cấp hai chế độ vận hành high và xhigh. Trong chế độ Agent chủ yếu thực hiện nhiều bước và gọi công cụ (high), điểm số PinchBench đạt 87.60, cao hơn GPT-5.4 xHigh và Gemini-3.1-Pro high, điểm kiểm tra ClawEval đạt 63.82. Trong chế độ suy nghĩ sâu dành cho lý luận toán học và nghiên cứu khoa học (xhigh), điểm AIME 26 đạt 95.83, điểm GPQA Diamond đạt 88.27.

Trang chính thức cho biết, chuyển đổi định dạng văn bản và cuộc thi toán học yêu cầu về sức mạnh tính toán hoàn toàn khác nhau, cơ chế này được thiết kế để giảm thiểu chi phí Token, giúp mô hình có thể đóng vai trò nền tảng mặc định cho các kịch bản như tổ chức công cụ, lập trình và tương tác nhiều vòng. Mô hình từ hôm nay hợp tác cùng Novita cung cấp thử API miễn phí trong một tuần trên nền tảng OpenRouter (đến ngày 15 tháng 5), và sẽ sớm mở mã trọng số.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim