Los costos de demostración de teoremas comienzan a aumentar: Mistral lanza Leanstral 1.5 de código abierto, aproximadamente $4 por problema

Según el monitoreo de Dongcha Beating, Mistral AI ha lanzado Leanstral 1.5, un modelo diseñado para demostraciones formales en Lean 4. El modelo tiene un total de 119 mil millones de parámetros, con aproximadamente 6.5 mil millones de parámetros activos, y está licenciado bajo el protocolo Apache-2.0, ofreciendo acceso gratuito a la API. Las evaluaciones oficiales muestran que Leanstral 1.5 resolvió 587 de 672 problemas en PutnamBench; obtuvo un 87% y un 34% en los benchmarks de álgebra abstracta FATE-H y FATE-X, respectivamente, estableciendo nuevos récords de rendimiento entre modelos similares. El costo promedio por problema para Leanstral 1.5 en PutnamBench es de aproximadamente $4, significativamente más bajo que los costos de varios sistemas anteriores, que oscilaban entre decenas y cientos de dólares. A medida que aumenta el presupuesto de tokens por problema, el número de problemas que puede resolver continúa aumentando; en la prueba de complejidad de los árboles AVL, el modelo completó la prueba relevante después de razonar sobre más de 2.7 millones de tokens y 22 compresiones de contexto. Además de las demostraciones matemáticas, Leanstral 1.5 también se ha utilizado para la verificación de código. El equipo descubrió 11 errores reales en 57 repositorios de código abierto de Rust, cinco de los cuales no habían sido reportados anteriormente.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado