MiniMax M3, estos parámetros están bastante fuertes, en 10 días de código abierto, esperando un momento realmente impresionante

Ver original
CoinNetwork
MiniMax lanza el gran modelo M3: capacidad de programación superior a GPT-5.5, admite control multióptico nativo en escritorio
La noticia de Jièjiè Wǎng, MiniMax lanza oficialmente hoy el gran modelo M3.
M3 es actualmente el único modelo de código abierto que combina los tres elementos de vanguardia: programación completa, contexto ultra largo y multimodalidad nativa, y planea liberar los pesos en 10 días.
Alcanzando niveles líderes internacionales en generación de código, agentes inteligentes y control de escritorio, se puede experimentar en MiniMax code, token plan y API.
M3 es pionero en la arquitectura de atención dispersa MSA, que agrupa las coincidencias de consulta mediante bloques KV, y la memoria de acceso es 4 veces más rápida que Flash-sparse-attention.
Con un contexto de aproximadamente 1 millón, la nueva arquitectura reduce la carga computacional por token a una vigésima parte de la generación anterior, logrando una aceleración de 9 veces en prellenado y 15 veces en decodificación.
En SWE-bench pro, M3 obtuvo un puntaje del 59.0%, superando a GPT-5.5 y Gemini 3.1.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado