MiniMax M3 這參數堆得有點狠,10天開源等個真香現場

查看原文
币 界 网
MiniMax發布M3大模型:編程能力超越GPT-5.5,支持原生多模態桌面操控
幣界網消息,MiniMax今日正式發布大模型M3。M3是目前唯一齊備編程、超長上下文與原生多模態三大前沿要素的開源路線大模型,計劃在10天內正式開源權重。在代碼生成、智能體和桌面操控上達國際領先水平,可在MiniMax code、token plan及API中體驗。M3首創稀疏注意力架構MSA,通過KV塊聚合命中查詢,訪存比Flash-sparse-attention快4倍。在100萬上下文下,新架構將每token計算量降至上代的二十分之一,實現預填充9倍、解碼15倍加速。在SWE-bench pro上,M3取得59.0%成績,超越GPT-5.5與Gemini 3.1
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆