定理證明成本開始上升:Mistral 發布開源 Leanstral 1.5,每個問題約 4 美元

根據洞查打的監控,Mistral AI 發布了 Leanstral 1.5,這是一個專為 Lean 4 形式化證明設計的模型。該模型總共有 1190 億個參數,其中約有 65 億個活躍參數,採用 Apache-2.0 協議授權,並提供免費的 API 存取。官方評測顯示,Leanstral 1.5 在 PutnamBench 上解決了 672 個問題中的 587 個;它在抽象代數基準測試 FATE-H 和 FATE-X 上分別達到了 87% 和 34% 的成績,創下了同類模型的新性能紀錄。Leanstral 1.5 在 PutnamBench 上每個問題的平均成本約為 4 美元,遠低於先前幾個系統的數十到數百美元成本。隨著每個問題的代幣預算增加,它能解決的問題數量持續上升;在 AVL 樹的複雜性證明中,該模型在推理超過 270 萬個代幣和 22 次上下文壓縮後完成了相關證明。除了數學證明,Leanstral 1.5 也被用於程式碼驗證。團隊在 57 個開源 Rust 程式庫中發現了 11 個真實錯誤,其中 5 個是之前未曾報告過的。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆