MiniMax khung chứng minh toán học mã nguồn mở MaxProof, sử dụng tìm kiếm tiến hóa để đẩy M3 lên đường huy chương vàng

robot
Đang tạo bản tóm tắt
Tin tức từ CoinWorld, trưởng bộ phận quan hệ nhà phát triển của MiniMax Ryan Lee thông báo rằng khung mở rộng MaxProof dành cho thử nghiệm chứng minh toán học của mô hình lớn đã chính thức được mở mã nguồn và phát hành bài báo kỹ thuật đi kèm. MaxProof sẽ tái cấu trúc quá trình suy luận chứng minh toán học thành hệ thống tìm kiếm tiến hóa, thông qua cơ chế xác minh, sửa chữa và loại bỏ để mở rộng quy mô trong quá trình suy luận. Dưới sự hỗ trợ của khung MaxProof, mô hình MiniMax-M3 đã đạt được 35 điểm và 36 điểm (trên tổng số 42 điểm) trong bộ thử nghiệm của kỳ thi Toán học Olympic quốc tế (IMO 2025) và Olympic Toán học Mỹ (USAMO 2026), đều đạt ngưỡng huy chương vàng. Khung này kết hợp khả năng của ba chuyên gia tạo sinh, xác minh và sửa chữa, xây dựng cơ chế xác minh nhiều lớp phòng thủ, thành công chuyển đổi khả năng chứng minh toán học tối ưu của mô hình thành hiệu suất ổn định hơn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • 2
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
LateFeeLeo
· 8giờ trước
Bạn có liên kết bài báo kỹ thuật không? Muốn xem xét kỹ các thí nghiệm loại bỏ chiến lược sửa chữa.
Xem bản gốcTrả lời0
ReflectionsOnTheStreetCorner
· 8giờ trước
Tư duy kết hợp tìm kiếm tiến hóa + ba khả năng rất thú vị, cảm giác hiệu quả hơn nhiều so với chỉ thu thập mẫu thuần túy, tiết kiệm công suất tính toán.
Xem bản gốcTrả lời0
QuantsAndCats
· 8giờ trước
MiniMax-M3 này thực sự có thể thi đấu, nhưng điểm chuẩn huy chương vàng IMO mỗi năm đều dao động, dữ liệu năm 2025 chờ đợi công bố chính thức rồi mới ăn mừng.
Xem bản gốcTrả lời0
SlippageSailor
· 8giờ trước
Mã nguồn mở rồi à? Vậy tôi sẽ đi xem mã nguồn để kiểm tra cách thiết kế module xác thực như thế nào
Xem bản gốcTrả lời0
  • Đã ghim