Os custos de prova de teoremas começam a subir: Mistral lança o Leanstral 1.5 de código aberto, aproximadamente US$ 4 por problema

De acordo com o monitoramento da Dongcha Beating, a Mistral AI lançou o Leanstral 1.5, um modelo projetado para provas formais em Lean 4. O modelo possui um total de 119 bilhões de parâmetros, com aproximadamente 6,5 bilhões de parâmetros ativos, e é licenciado sob o protocolo Apache-2.0, oferecendo acesso gratuito à API. Avaliações oficiais mostram que o Leanstral 1.5 resolveu 587 de 672 problemas no PutnamBench; alcançou 87% e 34% nos benchmarks de álgebra abstrata FATE-H e FATE-X, respectivamente, estabelecendo novos recordes de desempenho entre modelos semelhantes. O custo médio por problema para o Leanstral 1.5 no PutnamBench é de cerca de US$ 4, significativamente menor do que os custos de vários sistemas anteriores, que variavam de dezenas a centenas de dólares. À medida que o orçamento de tokens por problema aumenta, o número de problemas que ele pode resolver continua a crescer; na prova de complexidade de árvores AVL, o modelo completou a prova relevante após raciocinar sobre mais de 2,7 milhões de tokens e 22 compressões de contexto. Além de provas matemáticas, o Leanstral 1.5 também foi usado para verificação de código. A equipe descobriu 11 bugs reais em 57 repositórios Rust de código aberto, cinco dos quais não haviam sido relatados anteriormente.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado