Витрати на доведення теорем починають зростати: Mistral випускає відкритий код Leanstral 1.5, приблизно $4 за задачу

За даними моніторингу Dongcha Beating, компанія Mistral AI випустила Leanstral 1.5 — модель, призначену для формальних доведень у Lean 4. Модель має загалом 119 мільярдів параметрів, з яких приблизно 6,5 мільярдів активних, і ліцензується за протоколом Apache-2.0 з безкоштовним API доступом. Офіційні оцінки показують, що Leanstral 1.5 розв'язав 587 із 672 задач на PutnamBench; він досяг 87% та 34% на еталонах абстрактної алгебри FATE-H та FATE-X відповідно, встановивши нові рекорди продуктивності серед подібних моделей. Середня вартість однієї задачі для Leanstral 1.5 на PutnamBench становить близько 4 доларів, що значно нижче вартості кількох попередніх систем, які коливалися від десятків до сотень доларів. Зі збільшенням бюджету токенів на задачу кількість розв'язуваних задач продовжує зростати; у доведенні складності AVL-дерев модель завершила відповідне доведення після обробки понад 2,7 мільйона токенів та 22 стиснень контексту. Окрім математичних доведень, Leanstral 1.5 також використовувався для верифікації коду. Команда виявила 11 реальних помилок у 57 відкритих Rust-репозиторіях, п'ять з яких раніше не повідомлялися.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено