MiniMax M3 这参数堆得有点狠,10天开源等个真香现场

币 界 网
MiniMax发布M3大模型:编程能力超越GPT-5.5,支持原生多模态桌面操控
币界网消息,MiniMax今日正式发布大模型M3。M3是目前唯一齐备编程、超长上下文与原生多模态三大前沿要素的开源路线大模型,计划在10天内正式开源权重。在代码生成、智能体和桌面操控上达国际领先水平,可在MiniMax code、token plan及API中体验。M3首创稀疏注意力架构MSA,通过KV块聚合命中查询,访存比Flash-sparse-attention快4倍。在100万上下文下,新架构将每token计算量降至上代的二十分之一,实现预填充9倍、解码15倍加速。在SWE-bench pro上,M3取得59.0%成绩,超越GPT-5.5与Gemini 3.1
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论