Model Qwen 3.6 27B Dense mencapai 40 tok/s di RTX 3090

robot
Pembuatan abstrak sedang berlangsung

AIMPACT Pesan, 24 April 2026 (UTC+8), pengguna @sudoingX merilis hasil pengujian awal: Model Qwen 3.6 27B Dense dijalankan pada satu kartu RTX 3090 24GB dengan kecepatan 40 tok/s melewati pengujian 10/10. Hasil ini tidak menggunakan teknik kuantisasi atau kernel fusion, hanya menggunakan kuantisasi langsung Q4_K_M dari llama.cpp. Pengguna juga menulis sebuah pengujian benchmark swarm partikel untuk mengevaluasi model tersebut. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan