Chi phí chứng minh định lý bắt đầu tăng: Mistral phát hành Leanstral 1.5 mã nguồn mở, khoảng $4 mỗi bài toán

Theo giám sát của Dongcha Beating, Mistral AI đã phát hành Leanstral 1.5, một mô hình được thiết kế cho các chứng minh hình thức trong Lean 4. Mô hình có tổng cộng 119 tỷ tham số, với khoảng 6,5 tỷ tham số hoạt động, được cấp phép theo giao thức Apache-2.0 và cung cấp quyền truy cập API miễn phí. Các đánh giá chính thức cho thấy Leanstral 1.5 đã giải được 587 trong số 672 bài toán trên PutnamBench; nó đạt 87% và 34% trên các điểm chuẩn đại số trừu tượng FATE-H và FATE-X, lập kỷ lục hiệu suất mới trong số các mô hình tương tự. Chi phí trung bình cho mỗi bài toán của Leanstral 1.5 trên PutnamBench là khoảng 4 đô la, thấp hơn đáng kể so với chi phí của một số hệ thống trước đây, dao động từ hàng chục đến hàng trăm đô la. Khi ngân sách token cho mỗi bài toán tăng lên, số lượng bài toán nó có thể giải quyết tiếp tục tăng; trong chứng minh độ phức tạp của cây AVL, mô hình đã hoàn thành chứng minh liên quan sau khi suy luận trên hơn 2,7 triệu token và 22 lần nén ngữ cảnh. Ngoài các chứng minh toán học, Leanstral 1.5 còn được sử dụng để xác minh mã. Nhóm nghiên cứu đã phát hiện 11 lỗi thực tế trong 57 kho lưu trữ Rust mã nguồn mở, trong đó năm lỗi chưa từng được báo cáo trước đây.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim