За даними моніторингу Dongcha Beating, компанія Mistral AI випустила Leanstral 1.5 — модель, призначену для формальних доведень у Lean 4. Модель має загалом 119 мільярдів параметрів, з яких приблизно 6,5 мільярдів активних, і ліцензується за протоколом Apache-2.0 з безкоштовним API доступом. Офіційні оцінки показують, що Leanstral 1.5 розв'язав 587 із 672 задач на PutnamBench; він досяг 87% та 34% на еталонах абстрактної алгебри FATE-H та FATE-X відповідно, встановивши нові рекорди продуктивності серед подібних моделей. Середня вартість однієї задачі для Leanstral 1.5 на PutnamBench становить близько 4 доларів, що значно нижче вартості кількох попередніх систем, які коливалися від десятків до сотень доларів. Зі збільшенням бюджету токенів на задачу кількість розв'язуваних задач продовжує зростати; у доведенні складності AVL-дерев модель завершила відповідне доведення після обробки понад 2,7 мільйона токенів та 22 стиснень контексту. Окрім математичних доведень, Leanstral 1.5 також використовувався для верифікації коду. Команда виявила 11 реальних помилок у 57 відкритих Rust-репозиторіях, п'ять з яких раніше не повідомлялися.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
gStocksTokenizedStocksLive
4,78M Популярність
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,05M Популярність
#
IsraelStrikesIranBTCPlunges
68,08K Популярність
#
PredictWorldCupShare20000U
197,08K Популярність
#
ETHBreaks1700
152,56M Популярність

Закріплено

карта сайту

Витрати на доведення теорем починають зростати: Mistral випускає відкритий код Leanstral 1.5, приблизно $4 за задачу

Популярні теми

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Закріплено