La démonstration de théorèmes commence aussi à compresser les coûts : Mistral ouvre le code source de Leanstral 1.5, environ 4 dollars par question.

Selon la surveillance de Dongcha Beating, Mistral AI a open-sourcé Leanstral 1.5, un modèle dédié aux preuves formelles en Lean 4. Le modèle compte 119 milliards de paramètres totaux, avec environ 6,5 milliards de paramètres actifs, sous licence Apache-2.0, et propose un accès API gratuit. Les évaluations officielles montrent que Leanstral 1.5 résout 587 des 672 problèmes de PutnamBench ; il atteint respectivement 87 % et 34 % sur les benchmarks d'algèbre abstraite FATE-H et FATE-X, établissant les meilleures performances parmi les modèles similaires. Le coût moyen de résolution par problème sur PutnamBench est d'environ 4 dollars, bien inférieur aux dizaines ou centaines de dollars de certains systèmes précédents. À mesure que le budget de tokens par problème augmente, le nombre de problèmes résolus continue de croître ; dans la preuve de complexité des arbres AVL, le modèle a effectué un raisonnement de plus de 2,7 millions de tokens et 22 compressions de contexte avant de finaliser la preuve correspondante. Outre les preuves mathématiques, Leanstral 1.5 est également utilisé pour la vérification de code. L'équipe a découvert 11 bugs réels dans 57 dépôts Rust open source, dont 5 n'avaient jamais été signalés auparavant.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé