За даними моніторингу Дунча Beating, Mistral AI опублікувала з відкритим кодом Leanstral 1.5, модель для формального доведення в Lean 4.
Загальна кількість параметрів моделі — 119 мільярдів, активованих параметрів — близько 6,5 мільярдів, використовується ліцензія Apache-2.0, надається безкоштовний API-доступ.
Офіційне тестування показує, що Leanstral 1.5 розв’язала 587 із 672 задач PutnamBench; на абстрактних алгебраїчних бенчмарках FATE-H і FATE-X досягла 87% та 34% відповідно, оновивши найкращі показники серед аналогічних моделей.
Середня вартість розв’язання однієї задачі в PutnamBench для Leanstral 1.5 становить близько 4 доларів США, що нижче за вартість деяких попередніх систем у десятки або сотні доларів. Зі збільшенням бюджету токенів на одну задачу кількість розв’язаних задач постійно зростає; у доведенні складності AVL-дерева модель після понад 2,7 мільйона токенів міркувань і 22 стиснень контексту остаточно завершила відповідне доведення.
Окрім математичних доведень, Leanstral 1.5 також використовується для верифікації коду. Команда виявила 11 реальних помилок у 57 відкритих репозиторіях Rust, з яких 5 раніше не були зареєстровані.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
gStocksTokenizedStocksLive
4,76M Популярність
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,04M Популярність
#
IsraelStrikesIranBTCPlunges
68,04K Популярність
#
PredictWorldCupShare20000U
187,55K Популярність
#
ETHBreaks1700
152,56M Популярність

Закріплено

карта сайту

Теорема доведення також почала конкурувати за витрати: Mistral відкриває Leanstral 1.5, близько 4 доларів за задачу.

Популярні теми

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Закріплено