bartowski publicó el archivo GGUF cuantificado IQ4_NL basado en Gemma-4 26B-A4B-it MoE

robot
Generación de resúmenes en curso

Mensaje de ME News, el 4 de abril (UTC+8). Recientemente, el usuario @outsource_ publicó un mensaje en el que afirma que ya se ha publicado el archivo cuantificado GGUF IQ4_NL basado en el modelo Google Gemma-4 26B-A4B-it MoE. El modelo tiene un total de aproximadamente 26.000 millones de parámetros y activa aproximadamente 4.000 millones de parámetros. El archivo cuantificado fue elaborado por bartowski, y se realizó una revisión y cuantificación utilizando imatrix de llama.cpp. El nombre del archivo cuantificado es gemma-4-26B-A4B-it-IQ4_NL.gguf, con un tamaño de 14.70 GB. (Fuente: InFoQ)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado