Qwen3.7-Max resmi dirilis: 35 jam menulis kode secara mandiri sebanyak 1158 kali, menghasilkan operator percepatan 10 kali lipat di chip domestik

robot
Pembuatan abstrak sedang berlangsung
Menurut pemantauan Beating, Alibaba Tongyi Qianwen resmi merilis generasi baru fondasi agen cerdas Qwen3.7-Max. Data praktis yang diumumkan secara resmi menunjukkan bahwa, tanpa dokumen arsitektur chip maupun data analisis kinerja, model baru ini dalam sebuah tugas optimisasi kernel mandiri yang berlangsung selama 35 jam dan melibatkan 1158 panggilan alat, secara paksa meningkatkan performa operator Triton dari prosesor domestik Penghead Ge M890 sebesar 10,0 kali.

Dalam proses optimisasi, model mengalami lima tahap evolusi inti. Pertama, melalui pembagian Split-K membagi cache KV prefix sepanjang dimensi token untuk mengisi 36 inti SM; kemudian mengganti cudaMalloc yang sinkron antara host dan perangkat dengan variabel PyTorch yang telah dialokasikan sebelumnya, dan dengan menggunakan metadata tensor secara penuh menghapus tindakan cudaMemcpy sinkron saat menanyakan panjang prefix, secara total menghilangkan biaya komunikasi antara host dan perangkat; pada tahap terakhir, operator direkonstruksi agar dapat memproses keempat token query secara bersamaan dalam satu blok thread, berbagi pemuatan untuk membagi beban akses memori, menyelesaikan rekonstruksi spesialisasi arsitektur penting.

Pengujian optimisasi operator menunjukkan bahwa Qwen3.7-Max mencapai percepatan rata-rata geometris 10,0x, secara signifikan melampaui GLM 5.1 (7,3x) dan Kimi K2.6 (5,0x). Sedangkan DeepSeek V4 Pro hanya mencapai 3,3x dan dalam tahap kedua belas berhenti lebih awal karena tidak mengeluarkan panggilan alat selama lima putaran berturut-turut.

Untuk menguasai strategi pemecahan masalah umum dalam lingkungan yang berubah-ubah, Qwen3.7-Max selama pelatihan memisahkan tugas, kerangka kerja menjalankan, dan validator, serta melalui pelatihan reinforcement learning lintas kerangka untuk menghindari overfitting terhadap benchmark tertentu. Pada benchmark agen cerdas umum MCP-Mark (60,8 poin) dan SpreadSheetBench (87,0 poin), Qwen3.7-Max menunjukkan generalisasi yang sangat kuat, dan kinerja komprehensifnya sudah mendekati Claude-4.6-Opus-Max.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan