MiniMax M3 esta configuração é bastante agressiva, esperar 10 dias para o código aberto é um verdadeiro espetáculo de antecipação

Ver original
CoinNetwork
MiniMax lança o grande modelo M3: capacidade de programação superior ao GPT-5.5, suportando controlo multimodal nativo de desktop
Notícias do site CoinWorld, a MiniMax lançou oficialmente hoje o grande modelo M3. O M3 é atualmente o único grande modelo de código aberto que combina os três elementos de ponta: programação completa, contexto ultra longo e multimodalidade nativa, com planos de liberar os pesos oficialmente em 10 dias. Com níveis de liderança internacional em geração de código, agentes inteligentes e controle de desktop, pode ser experimentado no MiniMax code, token plan e API. O M3 inovou com a arquitetura de atenção esparsa MSA, que agrega blocos KV para atingir as consultas, tornando o acesso à memória até 4 vezes mais rápido que o Flash-sparse-attention. Com um contexto de cerca de 1 milhão, a nova arquitetura reduz a quantidade de cálculo por token para um vigésimo do modelo anterior, acelerando a pré-preenchimento em 9 vezes e a decodificação em 15 vezes. No SWE-bench pro, o M3 obteve uma pontuação de 59,0%, superando GPT-5.5 e Gemini 3.1.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado