MiniMax lança o grande modelo M3: capacidade de programação superior ao GPT-5.5, suportando controle multimodal nativo de desktop

Notícias do Coinjie.com, a MiniMax lançou oficialmente hoje o grande modelo M3.
O M3 é atualmente o único grande modelo de código aberto que combina os três elementos de ponta: programação completa, contexto de ultra longa duração e multimodalidade nativa, com planos de liberar os pesos oficialmente em 10 dias.
Alcança nível internacional de liderança em geração de código, agentes inteligentes e controle de desktop, podendo ser experimentado no MiniMax code, token plan e API.
O M3 inovou com a arquitetura de atenção esparsa MSA, que agrega blocos KV para atingir as consultas, sendo 4 vezes mais rápido na busca de memória do que a atenção esparsa Flash.
Com um contexto de cerca de 1 milhão, a nova arquitetura reduziu a quantidade de cálculo por token para um vigésimo do modelo anterior, acelerando a pré-preenchimento em 9 vezes e a decodificação em 15 vezes.
No SWE-bench pro, o M3 obteve uma pontuação de 59,0%, superando GPT-5.5 e Gemini 3.1 pro, chegando perto do Opus 4.7.
Na tarefa de otimização de operadores FP8 no Hopper, realizou 1959 chamadas autônomas a ferramentas em 24 horas, elevando a taxa de utilização de hardware de 7,6% para 71,3%, com uma aceleração de 9,4 vezes.
A API já está disponível, oferecendo modos de inferência e rápido, com planos de liberar os pesos oficialmente em 10 dias.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 9
  • 1
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
ColdBrewSparklingWater
· 2h atrás
A quantidade de tokens por contexto de 1 milhão foi reduzida para 1/20, os jogadores de textos longos ficaram extasiados
Ver originalResponder0
ThereIsTvlInTheWind
· 11h atrás
SWE-bench pro 59% supera o GPT-5.5, a capacidade de codificação realmente se destacou
Ver originalResponder0
SymbolsInTheReflection
· 12h atrás
Arquitetura MSA com acesso à memória 4 vezes mais rápido, Flash-sparse-attention se torna o pano de fundo
Ver originalResponder0
ThereAreCatsInTheContract.
· 12h atrás
Consulta detalhada sobre detalhes técnicos e artigos acadêmicos relacionados à consulta de acerto de agregação de blocos KV
Ver originalResponder0
PerpPulse
· 12h atrás
Gemini 3.1 foi ultrapassado? A pressão do lado do Google aumentou
Ver originalResponder0
TeaAndSlippage
· 12h atrás
Programação + contexto extremamente longo + multimodalidade nativa integrada, uma rota de código aberto única
Ver originalResponder0
GateUser-f7b40cee
· 12h atrás
O código MiniMax e a API já estão disponíveis para teste, é só experimentar.
Ver originalResponder0
DuskStop-LossLine
· 12h atrás
O controle de desktop atinge liderança internacional, o agente de IA avança ainda mais na implementação
Ver originalResponder0
AirdropMileCounter
· 12h atrás
Pré-preenchimento de 9 vezes, decodificação de 15 vezes, essa velocidade de aceleração é realmente absurda
Ver originalResponder0
Ver projetos
  • Fixado