bartowski merilis file GGUF kuantisasi IQ4_NL berbasis Gemma-4 26B-A4B-it MoE

MeNews · 2026-04-04T18:24:06+00:00

Pengguna @outsource_ memposting file GGUF kuantisasi IQ4_NL berbasis model Google Gemma-4 26B-A4B-it MoE, model ini mengandung sekitar 26 miliar parameter, ukuran file setelah kuantisasi adalah 14,70 GB, dibuat oleh bartowski.

MeNews

2026-04-04 18:24:06

Pembuatan abstrak sedang berlangsung

Pesan dari ME News: 4 April (UTC+8). Baru-baru ini, pengguna @outsource_ memposting kabar bahwa berkas kuantisasi IQ4_NL dalam format GGUF berdasarkan model Google Gemma-4 26B-A4B-it MoE telah dirilis. Model ini totalnya memiliki sekitar 26 miliar parameter, dengan aktivasi sekitar 4 miliar parameter. Berkas kuantisasi tersebut dibuat oleh bartowski, dengan menggunakan imatrix dari llama.cpp untuk revisi dan kuantisasi. Setelah dikuantisasi, nama berkasnya adalah gemma-4-26B-A4B-it-IQ4_NL.gguf, dengan ukuran 14.70 GB. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.