A prova de teoremas também começa a competir em custo: Mistral lança o Leanstral 1.5 de código aberto, cerca de 4 dólares por pergunta.

De acordo com a monitorização da 动察 Beating, a Mistral AI abriu o código do Leanstral 1.5, um modelo orientado para provas formais em Lean 4.
O modelo tem um total de 119 mil milhões de parâmetros, cerca de 6,5 mil milhões de parâmetros ativos, utiliza a licença Apache-2.0 e oferece acesso gratuito à API.
Avaliações oficiais mostram que o Leanstral 1.5 resolveu 587 dos 672 problemas no PutnamBench; nos benchmarks de álgebra abstrata FATE-H e FATE-X, alcançou 87% e 34% respetivamente, estabelecendo o melhor desempenho entre modelos semelhantes.
O custo médio de resolução de problemas no PutnamBench para o Leanstral 1.5 é de cerca de 4 dólares, inferior ao custo de dezenas a centenas de dólares de alguns sistemas anteriores.
À medida que o orçamento de tokens por problema aumenta, o número de problemas resolvidos continua a aumentar; na prova de complexidade de árvores AVL, o modelo passou por mais de 2,7 milhões de tokens de raciocínio e 22 compressões de contexto, concluindo finalmente a prova correspondente.
Além de provas matemáticas, o Leanstral 1.5 também é utilizado para verificação de código.
A equipa encontrou 11 bugs reais em 57 repositórios Rust de código aberto, dos quais 5 não tinham sido reportados anteriormente.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado