MiniMax estrutura de prova matemática de código aberto MaxProof, usando busca evolutiva para levar M3 até a linha de ouro

robot
Geração do resumo em andamento
Notícias do CoinWorld, o responsável pelo relacionamento com desenvolvedores da MiniMax, Ryan Lee, anunciou que o framework de expansão MaxProof para testes de provas matemáticas de grandes modelos foi oficialmente open source, juntamente com um artigo técnico complementar. MaxProof reconstrói a fase de raciocínio de provas matemáticas como um sistema de busca evolutiva, implementando escalabilidade de raciocínio por meio de mecanismos de validação, reparo e eliminação. Sob o suporte do framework MaxProof, o modelo MiniMax-M3 obteve 35 pontos na Olimpíada Internacional de Matemática (IMO 2025) e 36 pontos na Olimpíada de Matemática dos EUA (USAMO 2026) em seus conjuntos de testes, ambos atingindo a pontuação de medalha de ouro, com uma pontuação máxima de 42. Este framework, ao integrar as três principais capacidades de geração, validação e reparo, constrói um mecanismo de validação em múltiplos níveis de defesa, convertendo com sucesso a melhor capacidade do modelo em provas matemáticas em um desempenho mais estável.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 4
  • 2
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
LateFeeLeo
· 3h atrás
Você tem algum link para o artigo técnico? Gostaria de focar nos experimentos de ablação da estratégia de reparo.
Ver originalResponder0
ReflectionsOnTheStreetCorner
· 3h atrás
A ideia de busca evolutiva + fusão das três habilidades é interessante, parece muito mais eficiente do que apenas amostragem pura, economiza poder de processamento.
Ver originalResponder0
QuantsAndCats
· 3h atrás
MiniMax-M3 essa pontuação realmente é boa, mas a linha de medalha de ouro do IMO varia a cada ano, os dados de 2025 aguardam o lançamento oficial para comemorar.
Ver originalResponder0
SlippageSailor
· 3h atrás
Aberto ao público? Vou lá verificar o código para ver como o módulo de validação foi projetado.
Ver originalResponder0
  • Fixado