bartowski a publié le fichier GGUF quantifié IQ4_NL basé sur Gemma-4 26B-A4B-it MoE

robot
Création du résumé en cours

Actualités ME, message du 4 avril (UTC+8). Récemment, l’utilisateur @outsource_ a publié un message indiquant que le fichier quantifié IQ4_NL au format GGUF basé sur le modèle Google Gemma-4 26B-A4B-it MoE a été publié. Le modèle compte au total environ 26 milliards de paramètres, avec environ 4 milliards de paramètres activés. Le fichier quantifié a été réalisé par bartowski, en utilisant la fonctionnalité imatrix de llama.cpp pour révision et quantification. Le nom du fichier après quantification est gemma-4-26B-A4B-it-IQ4_NL.gguf, et sa taille est de 14.70 GB. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler