MiniMaxがM3大型モデルをリリース:プログラミング能力はGPT-5.5を超え、ネイティブなマルチモーダルデスクトップ操作をサポート

币界网消息,MiniMax今日正式发布大模型M3。
M3は現在唯一、完全なプログラミング、超長文脈、ネイティブなマルチモーダルの三大最先端要素を備えたオープンソースの大規模モデルであり、10日以内に重みを正式にオープンソース化する予定です。
コード生成、エージェント、デスクトップ操作において国際的に先進的なレベルを達成し、MiniMax code、token plan、APIで体験できます。
M3は新たに疎な注意力アーキテクチャMSAを導入し、KVブロックの集約によってクエリをヒットさせ、メモリアクセス速度はFlash-sparse-attentionの4倍高速です。
100万の文脈下で、新アーキテクチャは各トークンの計算量を従来の20分の1に削減し、事前埋め込みを9倍、デコードを15倍高速化します。
SWE-bench pro上で、M3は59.0%の成績を収め、GPT-5.5やGemini 3.1 proを超え、Opus 4.7に近づいています。
Hopper最適化FP8演算子タスクでは、24時間以内にツールを1959回自主呼び出しし、ハードウェア利用率を7.6%から71.3%に向上させ、9.4倍の高速化を実現しました。
APIは既に公開されており、推論と高速モードを提供し、重みは10日以内にオープンソース化される予定です。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 8
  • 1
  • 共有
コメント
コメントを追加
コメントを追加
ThereIsTvlInTheWind
· 5時間前
SWE-bench pro 59%超GPT-5.5,コード能力の部分で本当に追いついた
原文表示返信0
SymbolsInTheReflection
· 5時間前
MSAアーキテクチャのメモリアクセス速度が4倍に向上、Flash-sparse-attentionが背景板となる
原文表示返信0
ThereAreCatsInTheContract.
· 5時間前
KVブロック集約ヒットクエリ、技術的詳細などの論文をじっくり読む
原文表示返信0
PerpPulse
· 5時間前
Gemini 3.1が超えられた?Google側のプレッシャーが来た
原文表示返信0
TeaAndSlippage
· 5時間前
プログラミング+超長いコンテキスト+ネイティブマルチモーダルの三位一体、オープンソースの道は唯一無二
原文表示返信0
GateUser-f7b40cee
· 5時間前
MiniMaxコードとAPIの体験版が公開されました。挑戦あるのみです。
原文表示返信0
DuskStop-LossLine
· 5時間前
デスクトップ操作は国際的にリードし、AIエージェントの実用化も一歩前進
原文表示返信0
AirdropMileCounter
· 5時間前
事前充填9倍、解码15倍,这加速比确实离谱
原文表示返信0
  • ピン留め