MiniMax 把 MSA 开源了,百万 token 上下文推理终于不用烧卡了,MIT 许可直接商用,这周蹲 M3 权重

币 界 网
MiniMax开源Blackwell专属注意力库,M3权重预计本周五发布
币界网报道,MiniMax宣布其面向NVIDIA Blackwell(SM100)的高性能注意力库MSA已开源,MIT许可,MiniMax-M3权重本周发布。MSA通过筛选KV块,仅对相关块执行注意力,支持百万级上下文推理。研究显示,在1M token情境下,MSA比Dense GQA大幅降低计算量,并在H800上实现显著加速。开源版本集成C++ JIT与 Cute-DSL,支持多精度。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论