広場
最新
注目
ニュース
プロフィール
ポスト
MiniMaxがM3大型モデルをリリース:プログラミング能力はGPT-5.5を超え、ネイティブなマルチモーダルデスクトップ操作をサポート
CoinNetwork
2026-06-01 01:50:59
フォロー
币界网消息,MiniMax今日正式发布大模型M3。
M3は現在唯一、完全なプログラミング、超長文脈、ネイティブなマルチモーダルの三大最先端要素を備えたオープンソースの大規模モデルであり、10日以内に重みを正式にオープンソース化する予定です。
コード生成、エージェント、デスクトップ操作において国際的に先進的なレベルを達成し、MiniMax code、token plan、APIで体験できます。
M3は新たに疎な注意力アーキテクチャMSAを導入し、KVブロックの集約によってクエリをヒットさせ、メモリアクセス速度はFlash-sparse-attentionの4倍高速です。
100万の文脈下で、新アーキテクチャは各トークンの計算量を従来の20分の1に削減し、事前埋め込みを9倍、デコードを15倍高速化します。
SWE-bench pro上で、M3は59.0%の成績を収め、GPT-5.5やGemini 3.1 proを超え、Opus 4.7に近づいています。
Hopper最適化FP8演算子タスクでは、24時間以内にツールを1959回自主呼び出しし、ハードウェア利用率を7.6%から71.3%に向上させ、9.4倍の高速化を実現しました。
APIは既に公開されており、推論と高速モードを提供し、重みは10日以内にオープンソース化される予定です。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
8 いいね
報酬
8
8
1
共有
コメント
コメントを追加
コメントを追加
コメント
ThereIsTvlInTheWind
· 5時間前
SWE-bench pro 59%超GPT-5.5,コード能力の部分で本当に追いついた
原文表示
返信
0
SymbolsInTheReflection
· 5時間前
MSAアーキテクチャのメモリアクセス速度が4倍に向上、Flash-sparse-attentionが背景板となる
原文表示
返信
0
ThereAreCatsInTheContract.
· 5時間前
KVブロック集約ヒットクエリ、技術的詳細などの論文をじっくり読む
原文表示
返信
0
PerpPulse
· 5時間前
Gemini 3.1が超えられた?Google側のプレッシャーが来た
原文表示
返信
0
TeaAndSlippage
· 5時間前
プログラミング+超長いコンテキスト+ネイティブマルチモーダルの三位一体、オープンソースの道は唯一無二
原文表示
返信
0
GateUser-f7b40cee
· 5時間前
MiniMaxコードとAPIの体験版が公開されました。挑戦あるのみです。
原文表示
返信
0
DuskStop-LossLine
· 5時間前
デスクトップ操作は国際的にリードし、AIエージェントの実用化も一歩前進
原文表示
返信
0
AirdropMileCounter
· 5時間前
事前充填9倍、解码15倍,这加速比确实离谱
原文表示
返信
0
人気の話題
もっと見る
#
IntroducingGateStocks
34.5M 人気度
#
WinGoldBarsWithGrowthPoints
1.26M 人気度
#
IsraelStrikesIranBTCPlunges
51.75K 人気度
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M 人気度
#
USIranNegotiationGame
9.57M 人気度
ピン留め
サイトマップ
MiniMaxがM3大型モデルをリリース:プログラミング能力はGPT-5.5を超え、ネイティブなマルチモーダルデスクトップ操作をサポート
M3は現在唯一、完全なプログラミング、超長文脈、ネイティブなマルチモーダルの三大最先端要素を備えたオープンソースの大規模モデルであり、10日以内に重みを正式にオープンソース化する予定です。
コード生成、エージェント、デスクトップ操作において国際的に先進的なレベルを達成し、MiniMax code、token plan、APIで体験できます。
M3は新たに疎な注意力アーキテクチャMSAを導入し、KVブロックの集約によってクエリをヒットさせ、メモリアクセス速度はFlash-sparse-attentionの4倍高速です。
100万の文脈下で、新アーキテクチャは各トークンの計算量を従来の20分の1に削減し、事前埋め込みを9倍、デコードを15倍高速化します。
SWE-bench pro上で、M3は59.0%の成績を収め、GPT-5.5やGemini 3.1 proを超え、Opus 4.7に近づいています。
Hopper最適化FP8演算子タスクでは、24時間以内にツールを1959回自主呼び出しし、ハードウェア利用率を7.6%から71.3%に向上させ、9.4倍の高速化を実現しました。
APIは既に公開されており、推論と高速モードを提供し、重みは10日以内にオープンソース化される予定です。