Qwen3.7-Max resmi dirilis: Menulis kode secara mandiri 1158 kali dalam 35 jam, menghasilkan operator percepatan 10 kali lipat pada chip dalam negeri.

robot
Pembuatan abstrak sedang berlangsung
AIMPACT berita, 20 Mei (UTC+8), menurut pemantauan Dongcha Beating, Ali Tongyi Qianwen secara resmi merilis basis flagship agen generasi baru Qwen3.7-Max. Data pertempuran yang dirilis secara resmi menunjukkan, tanpa adanya dokumentasi arsitektur chip dan data analisis kinerja sama sekali, model baru dalam tugas optimalisasi kernel otonom penuh yang berlangsung selama 35 jam dan melibatkan 1.158 panggilan alat, berhasil meningkatkan kinerja operator Triton dari prosesor Pingtouge Zhenwu M890 buatan dalam negeri sebesar 10,0 kali lipat. Dalam proses optimalisasi, model melalui lima tahap evolusi inti. Pertama, melalui partisi Split-K, cache KV awalan dibagi berdasarkan dimensi token untuk mengisi 36 inti SM; kemudian, cudaMalloc yang sinkron antara host dan perangkat diganti dengan variabel PyTorch yang telah dialokasikan sebelumnya, dan dengan menggunakan metadata tensor, operasi cudaMemcpy sinkron saat menanyakan panjang awalan sepenuhnya dihapus, menghilangkan biaya komunikasi antara host dan perangkat; pada tahap akhir, model merekonstruksi operator untuk memproses keempat token kueri secara bersamaan dalam satu blok utas, berbagi beban untuk mendistribusikan biaya akses memori, menyelesaikan rekonstruksi spesialisasi arsitektur kritis. Pengukuran optimalisasi operator menunjukkan, Qwen3.7-Max mencapai rasio akselerasi geometrik rata-rata 10,0x, secara signifikan melampaui GLM 5.1 (7,3x) dan Kimi K2.6 (5,0x). Sementara DeepSeek V4 Pro hanya 3,3x dan pada paruh kedua secara proaktif mengakhiri tugas lebih awal karena tidak mengeluarkan panggilan alat selama lima putaran berturut-turut. Untuk menguasai strategi pemecahan masalah yang umum di lingkungan yang berubah-ubah, Qwen3.7-Max dalam pelatihan memisahkan tugas, kerangka kerja operasi, dan validator, dan melalui pelatihan pembelajaran penguatan lintas kerangka kerja menghindari overfitting jalan pintas terhadap tolok ukur tertentu. Pada tolok ukur agen umum MCP-Mark (skor 60,8) dan SpreadSheetBench (skor 87,0), Qwen3.7-Max menunjukkan generalisasi yang sangat kuat, kinerja komprehensifnya sudah mendekati Claude-4.6-Opus-Max. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan