MiniMax lança o grande modelo M3: capacidade de programação superior ao GPT-5.5, suportando controlo multimodal nativo de desktop

Notícias do site Coinjie, a MiniMax lançou oficialmente hoje o grande modelo M3.
O M3 é atualmente o único grande modelo de código aberto que combina os três elementos de ponta: programação completa, contexto ultra longo e multimodalidade nativa, com planos de liberar os pesos oficialmente em 10 dias.
Alcança um nível líder internacional em geração de código, agentes inteligentes e controle de desktop, podendo ser experimentado no MiniMax code, token plan e API.
O M3 inovou com a arquitetura de atenção esparsa MSA, que agrega hits de consulta através de blocos KV, tornando o acesso à memória 4 vezes mais rápido que o Flash-sparse-attention.
Com um contexto de cerca de 1 milhão, a nova arquitetura reduz a carga de cálculo por token para um vigésimo da geração anterior, acelerando a pré-preenchimento em 9 vezes e a decodificação em 15 vezes.
No SWE-bench pro, o M3 obteve uma pontuação de 59,0%, superando GPT-5.5 e Gemini 3.1 pro, chegando perto do Opus 4.7.
Na tarefa de otimização de operadores FP8 no Hopper, realizou 1959 chamadas autônomas a ferramentas em 24 horas, elevando a utilização de hardware de 7,6% para 71,3%, com uma aceleração de 9,4 vezes.
A API já está disponível, oferecendo modos de inferência e rápido, com planos de liberar os pesos em 10 dias.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 8
  • 1
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
ThereIsTvlInTheWind
· 5h atrás
SWE-bench pro 59% supera o GPT-5.5, a capacidade de codificação realmente se destacou
Ver originalResponder0
SymbolsInTheReflection
· 5h atrás
Arquitetura MSA com acesso à memória 4 vezes mais rápido, Flash-sparse-attention tornou-se o pano de fundo
Ver originalResponder0
ThereAreCatsInTheContract.
· 5h atrás
Consulta detalhada sobre detalhes técnicos e artigos acadêmicos relacionados à consulta de agregação de blocos KV
Ver originalResponder0
PerpPulse
· 5h atrás
O Gemini 3.1 foi ultrapassado? A pressão do lado do Google aumentou
Ver originalResponder0
TeaAndSlippage
· 5h atrás
Programação + contexto extremamente extenso + multimodalidade nativa integrada, uma rota de código aberto única
Ver originalResponder0
GateUser-f7b40cee
· 5h atrás
O código MiniMax e a API já estão disponíveis para teste, é só experimentar.
Ver originalResponder0
DuskStop-LossLine
· 5h atrás
O controlo de desktop lidera a nível internacional, e o agente de IA avança ainda mais na sua implementação
Ver originalResponder0
AirdropMileCounter
· 5h atrás
Pré-preenchimento de 9 vezes, decodificação de 15 vezes, essa velocidade de aceleração é realmente absurda
Ver originalResponder0
  • Fixado