MiniMax發布M3大模型:編程能力超越GPT-5.5,支持原生多模態桌面操控

币界網消息,MiniMax今日正式發布大模型M3。M3是目前唯一齊備編程、超長上下文與原生多模態三大前沿要素的開源路線大模型,計劃在10天內正式開源權重。在程式碼生成、智能體和桌面操控上達國際領先水平,可在MiniMax code、token plan及API中體驗。M3首創稀疏注意力架構MSA,通過KV塊聚合命中查詢,訪存比Flash-sparse-attention快4倍。在100萬上下文下,新架構將每token計算量降至上代的二十分之一,實現預填充9倍、解碼15倍加速。在SWE-bench pro上,M3取得59.0%成績,超越GPT-5.5與Gemini 3.1 pro,接近Opus 4.7。在Hopper優化FP8算子任務中,24小時內自主調用工具1959次,將硬體利用率從7.6%提升至71.3%,加速9.4倍。API現已上線,提供推理與快速模式,權重計劃10天內開源。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 8
  • 1
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
风里有TVL
· 5小時前
SWE-bench pro 59% 超 GPT-5.5,程式碼能力這方面真的站起來了
查看原文回復0
反光里的符号
· 6小時前
MSA架構訪存快4倍,Flash-sparse-attention成背景板了
查看原文回復0
合约里有猫
· 6小時前
KV塊聚合命中查詢,技術細節等論文細品
查看原文回復0
Perp Pulse
· 6小時前
Gemini 3.1 被超越了?谷歌那边壓力來了
查看原文回復0
TeaAndSlippage
· 6小時前
編程+超長上下文+原生多模態三合一,開源路線獨一份
查看原文回復0
GateUser-f7b40cee
· 6小時前
MiniMax 代碼和 API 已開放體驗,衝就完事了
查看原文回復0
黄昏止损线
· 6小時前
桌面操控達國際領先,AI Agent落地又進一步
查看原文回復0
Airdrop Mile Counter
· 6小時前
預填充9倍解碼15倍,這加速比確實離譜
查看原文回復0
  • 已置頂