MiniMax відкритий математичний доказовий каркас MaxProof, який за допомогою еволюційного пошуку піднімає M3 на золоту лінію

robot
Генерація анотацій у процесі
Звіт з Coinjie.com, керівник відносин з розробниками MiniMax Райан Лі оголосив, що тестовий розширювальний каркас MaxProof для математичних доведень великих моделей офіційно відкритий та опубліковано супровідний технічний документ. MaxProof перетворює етап розуміння математичних доведень у систему еволюційного пошуку, реалізуючи масштабування під час розуміння через механізми перевірки, виправлення та відбракування. За підтримки каркасу MaxProof модель MiniMax-M3 на тестових наборах Міжнародної математичної олімпіади (IMO 2025) та Американської математичної олімпіади (USAMO 2026) відповідно набрала 35 та 36 балів (з максимуму 42), обидві досягли золотого рівня. Цей каркас, поєднуючи три основні експертні можливості — генерацію, перевірку та виправлення, створює багаторівневий механізм захисту, успішно перетворюючи найкращі здатності моделі у математичних доведеннях у більш стабільну продуктивність.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • 2
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
LateFeeLeo
· 3год тому
Чи є посилання на технічний документ? Хотів би зосередитися на експерименті абляції стратегій виправлення.
Переглянути оригіналвідповісти на0
ReflectionsOnTheStreetCorner
· 3год тому
Еволюційний пошук + ідея об'єднання трьох здатностей — цікава концепція, здається, вона значно ефективніша за чисте випадкове зразкування, економить обчислювальні ресурси.
Переглянути оригіналвідповісти на0
QuantsAndCats
· 3год тому
MiniMax-M3 цей результат дійсно може бути, але золота межа IMO щороку коливається, дані за 2025 рік чекатимемо офіційного релізу, тоді й святкуватимемо.
Переглянути оригіналвідповісти на0
SlippageSailor
· 3год тому
Відкритий код? Тоді піду подивлюся код, щоб побачити, як спроектовано модуль валідації
Переглянути оригіналвідповісти на0
  • Закріплено