Menurut deteksi Beating, Qwen3.7-Max resmi dirilis. Tugas optimisasi inti mandiri penuh selama 35 jam, melibatkan 1158 kali panggilan alat, peningkatan 10x pada implementasi operator Triton M890 dari Tongfu. Lima tahap optimisasi termasuk pembagian cache Split-K, mengganti cudaMalloc dengan variabel pra-alokasi, menggunakan metadata tensor untuk menghilangkan pencarian prefix sinkronisasi, dan memproses 4 token query secara paralel dalam satu thread blok untuk berbagi pemuatan. Pengujian menunjukkan percepatan 10x, melampaui GLM5.1, Kimi K2.6, dan DeepSeek V4 Pro yang hanya 3.3x dan selesai tanpa panggilan alat di tahap akhir. Tugas/kerangka kerja/validator pelatihan yang dipisahkan, pembelajaran penguatan lintas kerangka kerja, MCP-Mark, SpreadSheetBench menunjukkan generalisasi yang kuat, mendekati Claude-4.6-Opus-Max.

BlockBeatNews

2026-05-20 03:36:50

Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, Alibaba Tongyi Qianwen resmi merilis generasi baru fondasi agen cerdas Qwen3.7-Max. Data praktis yang diumumkan secara resmi menunjukkan bahwa, tanpa dokumen arsitektur chip maupun data analisis kinerja, model baru ini dalam sebuah tugas optimisasi kernel mandiri yang berlangsung selama 35 jam dan melibatkan 1158 panggilan alat, secara paksa meningkatkan performa operator Triton dari prosesor domestik Penghead Ge M890 sebesar 10,0 kali.

Dalam proses optimisasi, model mengalami lima tahap evolusi inti. Pertama, melalui pembagian Split-K membagi cache KV prefix sepanjang dimensi token untuk mengisi 36 inti SM; kemudian mengganti cudaMalloc yang sinkron antara host dan perangkat dengan variabel PyTorch yang telah dialokasikan sebelumnya, dan dengan menggunakan metadata tensor secara penuh menghapus tindakan cudaMemcpy sinkron saat menanyakan panjang prefix, secara total menghilangkan biaya komunikasi antara host dan perangkat; pada tahap terakhir, operator direkonstruksi agar dapat memproses keempat token query secara bersamaan dalam satu blok thread, berbagi pemuatan untuk membagi beban akses memori, menyelesaikan rekonstruksi spesialisasi arsitektur penting.

Pengujian optimisasi operator menunjukkan bahwa Qwen3.7-Max mencapai percepatan rata-rata geometris 10,0x, secara signifikan melampaui GLM 5.1 (7,3x) dan Kimi K2.6 (5,0x). Sedangkan DeepSeek V4 Pro hanya mencapai 3,3x dan dalam tahap kedua belas berhenti lebih awal karena tidak mengeluarkan panggilan alat selama lima putaran berturut-turut.

Untuk menguasai strategi pemecahan masalah umum dalam lingkungan yang berubah-ubah, Qwen3.7-Max selama pelatihan memisahkan tugas, kerangka kerja menjalankan, dan validator, serta melalui pelatihan reinforcement learning lintas kerangka untuk menghindari overfitting terhadap benchmark tertentu. Pada benchmark agen cerdas umum MCP-Mark (60,8 poin) dan SpreadSheetBench (87,0 poin), Qwen3.7-Max menunjukkan generalisasi yang sangat kuat, dan kinerja komprehensifnya sudah mendekati Claude-4.6-Opus-Max.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
TradfiTradingChallenge
184.7K Popularitas
#
30YearTreasuryYieldBreaks5%
359.14K Popularitas
#
IsraelStrikesIranBTCPlunges
48.17K Popularitas
#
#DailyPolymarketHotspot
1M Popularitas
#
RWAMarketCapExceeds65Billion
8.75M Popularitas

Disematkan

peta situs

Qwen3.7-Max resmi dirilis: 35 jam menulis kode secara mandiri sebanyak 1158 kali, menghasilkan operator percepatan 10 kali lipat di chip domestik

Topik Trending

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Disematkan