MiniMax lanza el gran modelo M3: capacidad de programación superior a GPT-5.5, admite control multióptico nativo en escritorio

La noticia de Jièjiè Wang, MiniMax, lanzó oficialmente hoy el modelo grande M3.
M3 es actualmente el único modelo de código abierto que combina los tres elementos de vanguardia: programación completa, contexto ultralargo y multimodalidad nativa, y planea liberar los pesos en 10 días.
Alcanzando un nivel líder internacional en generación de código, agentes inteligentes y control de escritorio, se puede experimentar en MiniMax code, token plan y API.
M3 es pionero en la arquitectura de atención dispersa MSA, que agrupa las coincidencias de consulta mediante bloques KV, y la memoria de acceso es 4 veces más rápida que Flash-sparse-attention.
Con un contexto de aproximadamente un millón, la nueva arquitectura reduce la carga computacional por token a una vigésima parte de la generación anterior, logrando una aceleración de 9 veces en prellenado y 15 veces en decodificación.
En SWE-bench pro, M3 obtuvo un puntaje del 59.0%, superando a GPT-5.5 y Gemini 3.1 pro, acercándose a Opus 4.7.
En la tarea de optimización FP8 en Hopper, realizó 1959 llamadas autónomas a herramientas en 24 horas, elevando la utilización del hardware del 7.6% al 71.3%, con una aceleración de 9.4 veces.
La API ya está en línea, ofreciendo modos de inferencia y rápido, y los pesos se planean liberar en 10 días.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • 1
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
ThereIsTvlInTheWind
· hace5h
SWE-bench pro 59% supera a GPT-5.5, realmente ha mejorado en la capacidad de código
Ver originalResponder0
SymbolsInTheReflection
· hace5h
La arquitectura MSA accede a la memoria 4 veces más rápido, Flash-sparse-attention se ha convertido en el telón de fondo.
Ver originalResponder0
ThereAreCatsInTheContract.
· hace5h
Consulta detallada sobre la técnica de agregación de bloques KV, detalles técnicos y otros aspectos en artículos académicos
Ver originalResponder0
PerpPulse
· hace5h
¿Se ha superado Gemini 3.1? La presión en Google ha llegado
Ver originalResponder0
TeaAndSlippage
· hace5h
Programación + contexto extremadamente extenso + multimodalidad nativa en una sola, la ruta de código abierto es única
Ver originalResponder0
GateUser-f7b40cee
· hace5h
El código y la API de MiniMax ya están disponibles para prueba, solo hay que lanzarse.
Ver originalResponder0
DuskStop-LossLine
· hace5h
El control en escritorio alcanza un liderazgo internacional, y el despliegue del Agente de IA avanza aún más
Ver originalResponder0
AirdropMileCounter
· hace5h
Prellenado 9 veces, decodificación 15 veces, esta aceleración es realmente increíble
Ver originalResponder0
  • Fijado