bartowski merilis file GGUF kuantisasi IQ4_NL berbasis Gemma-4 26B-A4B-it MoE

robot
Pembuatan abstrak sedang berlangsung

Berita ME: Pesan, 4 April (UTC+8). Baru-baru ini, pengguna @outsource_ mempublikasikan sebuah pengumuman yang menyatakan bahwa file terkuantisasi IQ4_NL dalam format GGUF berbasis model Google Gemma-4 26B-A4B-it MoE telah dirilis. Model ini memiliki total sekitar 26 miliar parameter, dengan aktivasi sekitar 4 miliar parameter. File terkuantisasi dibuat oleh bartowski, menggunakan imatrix dari llama.cpp untuk revisi dan kuantisasi. Nama file setelah dikuantisasi adalah gemma-4-26B-A4B-it-IQ4_NL.gguf, dengan ukuran 14.70 GB. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan