Alibaba membuka akses ke generasi berikutnya dari flagship Qwen3.6-Max-Preview, dengan fokus pada pemrograman agen cerdas

robot
Pembuatan abstrak sedang berlangsung
BERITA ME, 20 April (UTC+8), menurut pemantauan Beating dari Dongcha, tim Alibaba Qianwen merilis Qwen3.6-Max-Preview, yang ditujukan sebagai versi pratinjau awal dari model flagship generasi berikutnya, menggantikan Qwen3.6-Plus yang ada. Pengguna dapat langsung berinteraksi melalui Qwen Studio (chat.qwen.ai), kemudian melalui API terbuka dengan nama model qwen3.6-max-preview di Alibaba Cloud Balian; antarmuka kompatibel dengan standar chat completions dan responses dari OpenAI serta protokol dari Anthropic. Versi ini terutama ditujukan untuk pemrograman agenik (agentic coding), memungkinkan model menulis kode sendiri seperti programmer, menjalankan, melihat pesan kesalahan, memanggil alat, dan menyelesaikan tugas pemrograman multi-langkah. Peningkatan yang diumumkan secara relatif terhadap pendahulunya Qwen3.6-Plus terutama fokus pada pemrograman: SkillsBench +9.9, SciCode +10.8, NL2Repo +5.0, Terminal-Bench 2.0 +3.8 poin; pengetahuan dunia dan format pemanggilan alat mengikuti tiga aspek lain dengan peningkatan antara 2.3 hingga 5.3 poin. Pihak resmi mengklaim mencapai skor tertinggi di enam benchmark pemrograman seperti SWE-bench Pro, Terminal-Bench 2.0, SciCode, di mana QwenClawBench dan QwenWebBench tampaknya merupakan koleksi pengujian buatan sendiri dari Qianwen, harus dilihat terpisah dari benchmark publik. Di sisi API, juga ditambahkan opsi preserve_thinking: setelah diaktifkan, pesan akan menyimpan beberapa putaran pemikiran sebelumnya. Model inferensi secara default hanya mengembalikan "pemikiran saat ini" sekali per putaran, sehingga dalam percakapan agenik multi-putaran, konteks kehilangan pemikiran dari langkah sebelumnya, dan saat model merencanakan ulang, mudah kembali ke jalur lama atau lupa apa yang sudah dicoba, fitur ini mengatasi kekurangan tersebut. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan