MiniMax M3 esses parâmetros estão bem pesados, aguardando 10 dias para o código aberto, esperando um momento de grande entusiasmo

Ver original
CoinNetwork
MiniMax lança o grande modelo M3: capacidade de programação superior ao GPT-5.5, suportando controle multimodal nativo de desktop
Notícias do Coinjie.com, a MiniMax lançou oficialmente hoje o grande modelo M3.
O M3 é atualmente o único grande modelo de código aberto que combina os três elementos de ponta: programação completa, contexto de comprimento ultra longo e multimodalidade nativa, planejando liberar os pesos oficialmente em 10 dias.
Alcança nível internacional de liderança em geração de código, agentes inteligentes e controle de desktop, podendo ser experimentado no MiniMax code, token plan e API.
O M3 inovou com a arquitetura de atenção esparsa MSA, que agrega blocos KV para atingir as consultas, sendo 4 vezes mais rápido na busca de memória do que a atenção esparsa Flash.
Com um contexto de cerca de 1 milhão, a nova arquitetura reduz o cálculo por token para um vigésimo do modelo anterior, realizando aceleração de 9 vezes na pré-preenchimento e 15 vezes na decodificação.
No SWE-bench pro, o M3 obteve uma pontuação de 59,0%, superando GPT-5.5 e Gemini 3.1.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado