MiniMax M3 このパラメータの積み上げはかなり激しいですね、10日間のオープンソース待ちの本当に香る現場

原文表示
CoinNetwork
MiniMaxがM3大型モデルをリリース:プログラミング能力はGPT-5.5を超え、ネイティブなマルチモーダルデスクトップ操作をサポート
币界网消息、MiniMax今日正式发布大模型M3。M3是目前唯一齐备编程、超长上下文与原生多模态三大前沿要素的开源路线大模型、计划在10天内正式开源权重。在代码生成、智能体和桌面操控上达国际领先水平、可在MiniMax code、token plan及API中体验。M3首创稀疏注意力架构MSA、通过KV块聚合命中查询、访存比Flash-sparse-attention快4倍。在100万上下文下、新架构将每token计算量降至上代的二十分之一、实现预填充9倍、解码15倍加速。在SWE-bench pro上、M3取得59.0%成绩、超越GPT-5.5与Gemini 3.1
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め