MiniMax发布M3大模型:编程能力超越GPT-5.5,支持原生多模态桌面操控

币界网消息,MiniMax今日正式发布大模型M3。M3是目前唯一齐备编程、超长上下文与原生多模态三大前沿要素的开源路线大模型,计划在10天内正式开源权重。在代码生成、智能体和桌面操控上达国际领先水平,可在MiniMax code、token plan及API中体验。M3首创稀疏注意力架构MSA,通过KV块聚合命中查询,访存比Flash-sparse-attention快4倍。在100万上下文下,新架构将每token计算量降至上代的二十分之一,实现预填充9倍、解码15倍加速。在SWE-bench pro上,M3取得59.0%成绩,超越GPT-5.5与Gemini 3.1 pro,接近Opus 4.7。在Hopper优化FP8算子任务中,24小时内自主调用工具1959次,将硬件利用率从7.6%提升至71.3%,加速9.4倍。API现已上线,提供推理与快速模式,权重计划10天内开源。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 8
  • 1
  • 分享
评论
请输入评论内容
请输入评论内容
风里有TVL
· 5小时前
SWE-bench pro 59%超GPT-5.5,代码能力这块真站起来了
回复0
反光里的符号
· 5小时前
MSA架构访存快4倍,Flash-sparse-attention成背景板了
回复0
合约里有猫
· 5小时前
KV块聚合命中查询,技术细节等论文细品
回复0
Perp Pulse
· 5小时前
Gemini 3.1被超了?Google那边压力来了
回复0
TeaAndSlippage
· 5小时前
编程+超长上下文+原生多模态三合一,开源路线独一份
回复0
GateUser-f7b40cee
· 5小时前
MiniMax code和API已开体验,冲就完事了
回复0
黄昏止损线
· 5小时前
桌面操控达国际领先,AI Agent落地又进一步
回复0
Airdrop Mile Counter
· 5小时前
预填充9倍解码15倍,这加速比属实离谱
回复0
  • 置顶