La noticia de Jièjiè Wang, MiniMax, lanzó oficialmente hoy el modelo grande M3.
M3 es actualmente el único modelo de código abierto que combina los tres elementos de vanguardia: programación completa, contexto ultralargo y multimodalidad nativa, y planea liberar los pesos en 10 días.
Alcanzando un nivel líder internacional en generación de código, agentes inteligentes y control de escritorio, se puede experimentar en MiniMax code, token plan y API.
M3 es pionero en la arquitectura de atención dispersa MSA, que agrupa las coincidencias de consulta mediante bloques KV, y la memoria de acceso es 4 veces más rápida que Flash-sparse-attention.
Con un contexto de aproximadamente un millón, la nueva arquitectura reduce la carga computacional por token a una vigésima parte de la generación anterior, logrando una aceleración de 9 veces en prellenado y 15 veces en decodificación.
En SWE-bench pro, M3 obtuvo un puntaje del 59.0%, superando a GPT-5.5 y Gemini 3.1 pro, acercándose a Opus 4.7.
En la tarea de optimización FP8 en Hopper, realizó 1959 llamadas autónomas a herramientas en 24 horas, elevando la utilización del hardware del 7.6% al 71.3%, con una aceleración de 9.4 veces.
La API ya está en línea, ofreciendo modos de inferencia y rápido, y los pesos se planean liberar en 10 días.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

8 me gusta

Recompensa
8
8
1
Compartir

Comentar

Añadir un comentario

ThereIsTvlInTheWind

· hace5h

SWE-bench pro 59% supera a GPT-5.5, realmente ha mejorado en la capacidad de código

Ver originalResponder0

SymbolsInTheReflection

· hace5h

La arquitectura MSA accede a la memoria 4 veces más rápido, Flash-sparse-attention se ha convertido en el telón de fondo.

Ver originalResponder0

ThereAreCatsInTheContract.

· hace5h

Consulta detallada sobre la técnica de agregación de bloques KV, detalles técnicos y otros aspectos en artículos académicos

Ver originalResponder0

PerpPulse

· hace5h

¿Se ha superado Gemini 3.1? La presión en Google ha llegado

Ver originalResponder0

TeaAndSlippage

· hace5h

Programación + contexto extremadamente extenso + multimodalidad nativa en una sola, la ruta de código abierto es única

Ver originalResponder0

GateUser-f7b40cee

· hace5h

El código y la API de MiniMax ya están disponibles para prueba, solo hay que lanzarse.

Ver originalResponder0

DuskStop-LossLine

· hace5h

El control en escritorio alcanza un liderazgo internacional, y el despliegue del Agente de IA avanza aún más

Ver originalResponder0

AirdropMileCounter

· hace5h

Prellenado 9 veces, decodificación 15 veces, esta aceleración es realmente increíble

Ver originalResponder0

Temas de actualidad
Ver más
#
IntroducingGateStocks
34.5M Popularidad
#
WinGoldBarsWithGrowthPoints
1.26M Popularidad
#
IsraelStrikesIranBTCPlunges
51.75K Popularidad
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M Popularidad
#
USIranNegotiationGame
9.57M Popularidad

Fijado

MiniMax lanza el gran modelo M3: capacidad de programación superior a GPT-5.5, admite control multióptico nativo en escritorio

Temas de actualidad

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Fijado