MiniMax rilis model besar M3: kemampuan pemrograman melampaui GPT-5.5, mendukung kontrol desktop multimodal asli

Berita dari Jiemaowang, MiniMax hari ini secara resmi merilis model besar M3.
M3 adalah satu-satunya model besar sumber terbuka yang lengkap saat ini dengan tiga elemen terdepan: pemrograman, konteks sangat panjang, dan multimodal asli, dan berencana untuk merilis bobot secara resmi dalam 10 hari.
Di bidang pembuatan kode, agen cerdas, dan kontrol desktop mencapai tingkat terdepan secara internasional, dapat dinikmati melalui MiniMax code, token plan, dan API.
M3 menciptakan arsitektur perhatian jarang MSA, yang menggabungkan blok KV untuk menjawab query, dan mengakses memori 4 kali lebih cepat dari Flash-sparse-attention.
Dengan konteks sekitar 1 juta, arsitektur baru ini menurunkan jumlah perhitungan per token menjadi seperdua puluh dari generasi sebelumnya, mempercepat pra-pengisian 9 kali dan decoding 15 kali.
Di atas SWE-bench pro, M3 meraih skor 59,0%, mengungguli GPT-5.5 dan Gemini 3.1 pro, mendekati Opus 4.7.
Dalam tugas optimasi FP8 Hopper, dalam 24 jam secara mandiri memanggil alat sebanyak 1959 kali, meningkatkan utilisasi hardware dari 7,6% menjadi 71,3%, percepatan 9,4 kali.
API kini sudah online, menyediakan mode inferensi dan mode cepat, dan rencana bobot akan dirilis secara open source dalam 10 hari.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • 1
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
ThereIsTvlInTheWind
· 5jam yang lalu
SWE-bench pro 59% lebih unggul dari GPT-5.5, kemampuan kode benar-benar meningkat
Lihat AsliBalas0
SymbolsInTheReflection
· 5jam yang lalu
Arsitektur MSA akses memori 4 kali lebih cepat, Flash-sparse-attention menjadi latar belakangnya
Lihat AsliBalas0
ThereAreCatsInTheContract.
· 5jam yang lalu
Kinerja pencarian gabungan blok KV, detail teknis dan analisis mendalam dari makalah
Lihat AsliBalas0
PerpPulse
· 5jam yang lalu
Gemini 3.1 telah dilampaui? Tekanan dari Google datang
Lihat AsliBalas0
TeaAndSlippage
· 5jam yang lalu
Pemrograman + konteks sangat panjang + multimodal asli tiga dalam satu, jalur sumber terbuka yang unik
Lihat AsliBalas0
GateUser-f7b40cee
· 5jam yang lalu
Kode MiniMax dan API telah dibuka untuk pengalaman, tinggal kejar saja.
Lihat AsliBalas0
DuskStop-LossLine
· 5jam yang lalu
Pengendalian desktop mencapai tingkat terdepan internasional, agen AI semakin mewujudkan penerapannya
Lihat AsliBalas0
AirdropMileCounter
· 5jam yang lalu
Pra-pengisian 9 kali lipat, decoding 15 kali lipat, kecepatan ini benar-benar luar biasa
Lihat AsliBalas0
  • Disematkan