По данным мониторинга Beating, Mistral AI выпустила с открытым исходным кодом Leanstral 1.5 — модель для формального доказательства в Lean 4. Общее количество параметров модели — 119 млрд, активируемых параметров — около 6,5 млрд, используется лицензия Apache-2.0, предоставляется бесплатный API-доступ. Официальные тесты показывают, что Leanstral 1.5 решает 587 из 672 задач PutnamBench; на эталонных тестах абстрактной алгебры FATE-H и FATE-X достигает 87% и 34% соответственно, обновляя лучшие результаты среди аналогов. Средняя стоимость решения одной задачи PutnamBench для Leanstral 1.5 составляет около 4 долларов, что ниже десятков и сотен долларов у некоторых предыдущих систем. С увеличением бюджета токенов на одну задачу количество решений продолжает расти; в доказательстве сложности AVL-дерева модель после более чем 2,7 млн токенов рассуждений и 22 сжатий контекста в итоге завершила соответствующее доказательство. Помимо математических доказательств, Leanstral 1.5 используется для верификации кода. Команда обнаружила 11 реальных багов в 57 открытых Rust-репозиториях, из которых 5 ранее не были зарегистрированы.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
gStocksTokenizedStocksLive
4,76M Популярность
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,04M Популярность
#
IsraelStrikesIranBTCPlunges
68,04K Популярность
#
PredictWorldCupShare20000U
187,55K Популярность
#
ETHBreaks1700
152,56M Популярность

Закреплено

Карта сайта

Теорема доказательства также начинает конкурировать по стоимости: Mistral открывает Leanstral 1.5, около 4 долларов за задачу.

Популярные темы

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Закреплено