定理証明もコスト競争が始まった:MistralがLeanstral 1.5をオープンソース化、1問あたり約4ドル

据 动察 Beating の監視によると、Mistral AI は Lean 4 形式証明向けのモデル Leanstral 1.5 をオープンソース化した。モデルの総パラメータ数は 1190 億、活性化パラメータは約 65 億で、Apache-2.0 ライセンスを採用し、無料の API アクセスを提供する。公式評価によると、Leanstral 1.5 は PutnamBench の 672 問中 587 問を解き、抽象代数ベンチマーク FATE-H および FATE-X でそれぞれ 87% と 34% を達成し、同種モデルの最高性能を更新した。Leanstral 1.5 の PutnamBench における平均問題解決コストは約 4 ドルで、以前の一部システムの数十~数百ドルを下回る。1問あたりのトークン予算を増やすにつれ、解決数は増加し続け、AVL 木の複雑性証明では、モデルは 270 万以上のトークン推論と 22 回のコンテキスト圧縮を経て、関連証明を完了した。数学的証明以外にも、Leanstral 1.5 はコード検証に使用されている。チームは 57 のオープンソース Rust リポジトリで 11 の実際のバグを発見し、そのうち 5 つはこれまで報告されていなかった。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め