La demostración de teoremas también empieza a competir en costos: Mistral lanza Leanstral 1.5 de código abierto, aproximadamente 4 dólares por problema.

Según el monitoreo de Dongcha Beating, Mistral AI ha lanzado Leanstral 1.5, un modelo orientado a la demostración formal en Lean 4. El modelo tiene un total de 119 mil millones de parámetros, con aproximadamente 6.5 mil millones de parámetros activos, está licenciado bajo Apache-2.0 y ofrece acceso gratuito a través de API. Las evaluaciones oficiales muestran que Leanstral 1.5 resuelve 587 de los 672 problemas en PutnamBench; en los benchmarks de álgebra abstracta FATE-H y FATE-X alcanza un 87% y un 34% respectivamente, estableciendo un nuevo récord entre modelos similares. El costo promedio de resolución de problemas de Leanstral 1.5 en PutnamBench es de aproximadamente 4 dólares, inferior a los costos de decenas a cientos de dólares de algunos sistemas anteriores. A medida que aumenta el presupuesto de tokens por problema, el número de problemas resueltos sigue incrementándose; en la prueba de complejidad del árbol AVL, el modelo realizó un razonamiento de más de 2.7 millones de tokens y 22 compresiones de contexto, completando finalmente la demostración correspondiente. Además de las demostraciones matemáticas, Leanstral 1.5 también se utiliza para la verificación de código. El equipo encontró 11 errores reales en 57 repositorios de Rust de código abierto, de los cuales 5 no habían sido reportados anteriormente.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado