Alibaba membuka generasi berikutnya dari flagship Qwen3.6-Max-Preview, menonjolkan pemrograman agen cerdas

robot
Pembuatan abstrak sedang berlangsung
Berita ME News, 20 April (UTC+8), menurut pemantauan Beating dari Dongcha, tim Alibaba Qianwen merilis Qwen3.6-Max-Preview, yang ditujukan sebagai versi pratinjau awal dari model flagship generasi berikutnya, menggantikan Qwen3.6-Plus yang ada. Pengguna dapat langsung berinteraksi melalui Qwen Studio (chat.qwen.ai), kemudian melalui Alibaba Cloud Baliani dengan nama model qwen3.6-max-preview untuk panggilan API; antarmuka kompatibel dengan standar chat completions dan responses dari OpenAI serta protokol dari Anthropic. Versi ini terutama ditujukan untuk pemrograman agenik (agentic coding), memungkinkan model menulis kode sendiri seperti programmer, menjalankan, melihat pesan kesalahan, memanggil alat, dan menyelesaikan tugas pemrograman multi-langkah. Peningkatan yang diberikan oleh resmi dibandingkan pendahulunya Qwen3.6-Plus terutama pada bidang pemrograman: SkillsBench +9.9, SciCode +10.8, NL2Repo +5.0, Terminal-Bench 2.0 +3.8 poin; pengetahuan dunia dan format pemanggilan alat mengikuti tiga aspek lain dengan peningkatan antara 2.3 hingga 5.3 poin. Resmi mengklaim mencapai skor tertinggi di enam benchmark pemrograman seperti SWE-bench Pro, Terminal-Bench 2.0, SciCode, di mana QwenClawBench dan QwenWebBench tampaknya merupakan kumpulan evaluasi buatan sendiri dari Qianwen, harus dilihat terpisah dari benchmark publik. Di sisi API, juga ditambahkan opsi preserve_thinking: setelah diaktifkan, pesan akan menyimpan konten pemikiran dari beberapa putaran sebelumnya. Model inferensi secara default hanya mengembalikan "pemikiran saat ini" sekali per putaran, dalam dialog agen cerdas multi-putaran, konteks kehilangan langkah-langkah pemikiran sebelumnya, sehingga saat model merencanakan ulang, mudah kembali ke jalur lama atau lupa apa yang sudah dicoba, fitur ini mengatasi kekurangan tersebut. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan