MiniMax M3 parameter ini cukup hebat, menunggu 10 hari untuk open source dan menantikan acara yang benar-benar memuaskan

Lihat Asli
CoinNetwork
MiniMax rilis model besar M3: kemampuan pemrograman melampaui GPT-5.5, mendukung kontrol desktop multimodal asli
Berita dari Jiemaowang, MiniMax hari ini secara resmi merilis model besar M3.
M3 adalah satu-satunya model besar sumber terbuka yang lengkap dengan tiga elemen terdepan: pemrograman, konteks sangat panjang, dan multimodal asli, saat ini, dan berencana untuk merilis bobot secara resmi dalam 10 hari.
Di bidang pembuatan kode, agen cerdas, dan kontrol desktop, mencapai tingkat terdepan secara internasional, dapat dinikmati melalui MiniMax code, token plan, dan API.
M3 inovatif dengan arsitektur perhatian jarang MSA, yang menggabungkan blok KV untuk menjawab query, akses memori 4 kali lebih cepat dari Flash-sparse-attention.
Dengan konteks sekitar 1 juta, arsitektur baru ini menurunkan jumlah perhitungan per token menjadi seperdua puluh dari generasi sebelumnya, mempercepat pra-pengisian 9 kali dan decoding 15 kali.
Di atas SWE-bench pro, M3 meraih skor 59,0%, melampaui GPT-5.5 dan Gemini 3.1.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan