Os Custos de Prova de Teoremas Começam a Aumentar: Mistral Lança o Leanstral 1.5 de Código Aberto, Aproximadamente $4 por Problema

De acordo com a monitorização do Dongcha Beating, a Mistral AI lançou o Leanstral 1.5, um modelo concebido para provas formais em Lean 4. O modelo tem um total de 119 mil milhões de parâmetros, com aproximadamente 6,5 mil milhões de parâmetros ativos, e está licenciado sob o protocolo Apache-2.0, oferecendo acesso gratuito à API. Avaliações oficiais mostram que o Leanstral 1.5 resolveu 587 dos 672 problemas no PutnamBench; alcançou 87% e 34% nos benchmarks de álgebra abstrata FATE-H e FATE-X, respetivamente, estabelecendo novos recordes de desempenho entre modelos semelhantes. O custo médio por problema do Leanstral 1.5 no PutnamBench é de cerca de 4 dólares, significativamente inferior aos custos de vários sistemas anteriores, que variavam de dezenas a centenas de dólares. À medida que o orçamento de tokens por problema aumenta, o número de problemas que consegue resolver continua a subir; na prova de complexidade das árvores AVL, o modelo completou a prova correspondente após raciocinar sobre mais de 2,7 milhões de tokens e 22 compressões de contexto. Além de provas matemáticas, o Leanstral 1.5 também foi utilizado para verificação de código. A equipa descobriu 11 erros reais em 57 repositórios Rust de código aberto, cinco dos quais não tinham sido reportados anteriormente.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado