[Chain News] Pada 24 September, Alibaba Cloud meluncurkan model besar Qwen3-Max yang terbesar hingga saat ini, dengan parameter lebih dari 1 triliun, dan menggunakan 36 triliun tokens untuk pratraining. Versi pratinjau Qwen3-Max-Instruct menempati peringkat ketiga secara global di papan peringkat teks LMArena, sementara versi resminya menunjukkan peningkatan dalam tugas pembuatan kode dan agen cerdas, dengan skor SWE-Bench Verified 69,6, dan skor Tau2-Bench 74,8. Versi perbaikan inferensi Qwen3-Max-Thinking meraih nilai sempurna dalam tes penalaran matematika AIME 25 dan HMMT. API kini sudah dibuka dan kompatibel dengan metode panggilan OpenAI.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Alibaba Cloud meluncurkan model besar Qwen3-Max dengan 100 miliar parameter, kinerjanya melampaui peringkat global.
[Chain News] Pada 24 September, Alibaba Cloud meluncurkan model besar Qwen3-Max yang terbesar hingga saat ini, dengan parameter lebih dari 1 triliun, dan menggunakan 36 triliun tokens untuk pratraining. Versi pratinjau Qwen3-Max-Instruct menempati peringkat ketiga secara global di papan peringkat teks LMArena, sementara versi resminya menunjukkan peningkatan dalam tugas pembuatan kode dan agen cerdas, dengan skor SWE-Bench Verified 69,6, dan skor Tau2-Bench 74,8. Versi perbaikan inferensi Qwen3-Max-Thinking meraih nilai sempurna dalam tes penalaran matematika AIME 25 dan HMMT. API kini sudah dibuka dan kompatibel dengan metode panggilan OpenAI.