MiniMax marco de pruebas matemáticas de código abierto MaxProof, que eleva M3 a la línea de oro mediante búsqueda evolutiva

robot
Generación de resúmenes en curso
Noticia de CoinWorld, el responsable de relaciones con desarrolladores de MiniMax, Ryan Lee, anunció que el marco de extensión MaxProof para pruebas de demostraciones matemáticas en modelos grandes ha sido oficialmente de código abierto, junto con la publicación de un artículo técnico complementario. MaxProof reconstruye las demostraciones matemáticas en la fase de razonamiento como un sistema de búsqueda evolutiva, logrando escalabilidad en el razonamiento mediante mecanismos de verificación, reparación y eliminación. Bajo el soporte del marco MaxProof, el modelo MiniMax-M3 obtuvo respectivamente 35 y 36 puntos (de un total de 42) en los conjuntos de pruebas de la Olimpiada Internacional de Matemáticas (IMO 2025) y la Olimpiada Matemática de Estados Unidos (USAMO 2026), alcanzando ambos la puntuación de medalla de oro. Este marco, al fusionar las capacidades de generación, verificación y reparación de tres expertos, construye un mecanismo de verificación de múltiples niveles de defensa, logrando convertir la mejor capacidad del modelo en demostraciones matemáticas en un rendimiento más estable.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • 2
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
LateFeeLeo
· hace3h
¿Tienes el enlace al artículo técnico? Quiero centrarme en los experimentos de ablación de la estrategia de reparación.
Ver originalResponder0
ReflectionsOnTheStreetCorner
· hace3h
La idea de combinar búsqueda evolutiva + fusión de las tres capacidades es interesante, parece mucho más eficiente que solo muestrear, ahorra poder de cómputo.
Ver originalResponder0
QuantsAndCats
· hace3h
MiniMax-M3, estos resultados realmente pueden competir, pero la línea de medallas de oro del IMO fluctúa cada año, los datos de 2025 esperarán el lanzamiento oficial para celebrarlo.
Ver originalResponder0
SlippageSailor
· hace3h
¿Abierto al código? Voy a revisar el código para ver cómo está diseñado el módulo de validación.
Ver originalResponder0
  • Fijado