Теорема доказательства также начинает конкурировать по стоимости: Mistral открывает Leanstral 1.5, около 4 долларов за задачу.

По данным мониторинга Beating, Mistral AI выпустила с открытым исходным кодом Leanstral 1.5 — модель для формального доказательства в Lean 4. Общее количество параметров модели — 119 млрд, активируемых параметров — около 6,5 млрд, используется лицензия Apache-2.0, предоставляется бесплатный API-доступ. Официальные тесты показывают, что Leanstral 1.5 решает 587 из 672 задач PutnamBench; на эталонных тестах абстрактной алгебры FATE-H и FATE-X достигает 87% и 34% соответственно, обновляя лучшие результаты среди аналогов. Средняя стоимость решения одной задачи PutnamBench для Leanstral 1.5 составляет около 4 долларов, что ниже десятков и сотен долларов у некоторых предыдущих систем. С увеличением бюджета токенов на одну задачу количество решений продолжает расти; в доказательстве сложности AVL-дерева модель после более чем 2,7 млн токенов рассуждений и 22 сжатий контекста в итоге завершила соответствующее доказательство. Помимо математических доказательств, Leanstral 1.5 используется для верификации кода. Команда обнаружила 11 реальных багов в 57 открытых Rust-репозиториях, из которых 5 ранее не были зарегистрированы.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено