Теорема доведення також почала конкурувати за витрати: Mistral відкриває Leanstral 1.5, близько 4 доларів за задачу.

За даними моніторингу Дунча Beating, Mistral AI опублікувала з відкритим кодом Leanstral 1.5, модель для формального доведення в Lean 4.
Загальна кількість параметрів моделі — 119 мільярдів, активованих параметрів — близько 6,5 мільярдів, використовується ліцензія Apache-2.0, надається безкоштовний API-доступ.
Офіційне тестування показує, що Leanstral 1.5 розв’язала 587 із 672 задач PutnamBench; на абстрактних алгебраїчних бенчмарках FATE-H і FATE-X досягла 87% та 34% відповідно, оновивши найкращі показники серед аналогічних моделей.
Середня вартість розв’язання однієї задачі в PutnamBench для Leanstral 1.5 становить близько 4 доларів США, що нижче за вартість деяких попередніх систем у десятки або сотні доларів. Зі збільшенням бюджету токенів на одну задачу кількість розв’язаних задач постійно зростає; у доведенні складності AVL-дерева модель після понад 2,7 мільйона токенів міркувань і 22 стиснень контексту остаточно завершила відповідне доведення.
Окрім математичних доведень, Leanstral 1.5 також використовується для верифікації коду. Команда виявила 11 реальних помилок у 57 відкритих репозиторіях Rust, з яких 5 раніше не були зареєстровані.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено