定理証明のコストが上昇し始める:MistralがオープンソースのLeanstral 1.5をリリース、1問題あたり約4ドル

Dongcha Beatingのモニタリングによると、Mistral AIはLean 4の形式証明用に設計されたモデル「Leanstral 1.5」をリリースした。このモデルは合計1190億のパラメータを持ち、そのうち約65億のパラメータがアクティブであり、Apache-2.0プロトコルの下でライセンスされ、無料のAPIアクセスを提供している。公式評価では、Leanstral 1.5はPutnamBenchの672問題のうち587問を解決し、抽象代数ベンチマークFATE-HとFATE-Xでそれぞれ87%と34%を達成し、類似モデルの中で新たな性能記録を樹立した。PutnamBenchでのLeanstral 1.5の問題あたりの平均コストは約4ドルで、以前の複数のシステムの数ドルから数百ドルというコストよりも大幅に低い。問題あたりのトークンバジェットが増加するにつれて、解決できる問題数も増加し続ける。AVL木の複雑性証明では、モデルは270万以上のトークンと22回のコンテキスト圧縮を推論した後に、関連する証明を完了した。数学的証明に加えて、Leanstral 1.5はコード検証にも使用されている。チームは57のオープンソースRustリポジトリで11の実際のバグを発見し、そのうち5つはこれまで報告されていなかった。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め