Ali mengurangi biaya sebesar delapan puluh persen melalui cache implisit ini, mimpi buruk pembakaran uang dari Agen konteks panjang akhirnya terpecahkan

Lihat Asli
CoinNetwork
Berita dari Coinjie.com, tim Qwen dari Alibaba mengumumkan bahwa platform Alibaba Cloud Bailing secara default mengaktifkan cache implisit otomatis untuk model flagship mereka, Qwen3.7-max. Pengembang tidak perlu mengubah kode atau menentukan parameter tambahan, sehingga dapat langsung menikmati pengurangan biaya cache. Dengan mekanisme penagihan yang baru, sistem secara otomatis mengenali dan mengekstrak awalan konteks yang berulang dalam permintaan. Begitu cache berhasil digunakan, biaya token input dari bagian yang cocok hanya dikenakan 20% dari harga satuan asli, mengurangi biaya input hingga delapan puluh persen. Cache implisit secara langsung ditujukan untuk mengurangi biaya besar dalam skenario teks panjang dan agen cerdas. Qwen3.7-max yang memiliki jendela konteks sepanjang 1 juta token, saat menjalankan tugas tingkat tinggi seperti pengkodean mandiri, membutuhkan pembacaan berulang yang sering terhadap basis kode besar atau dokumen pengetahuan.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan