bartowski опубликовал файл GGUF для квантования IQ4_NL на базе Gemma-4 26B-A4B-it MoE

robot
Генерация тезисов в процессе

Сообщение ME News, 4 апреля (UTC+8). В последнее время пользователь @outsource_ опубликовал информацию о том, что выпущен квантованный GGUF-файл IQ4_NL на базе модели IQ4_NL, основанной на Google Gemma-4 26B-A4B-it MoE. Эта модель в общей сложности насчитывает около 26 миллиардов параметров, а активации — около 4 миллиардов параметров. Квантованный файл подготовлен bartowski; при этом для доработки и квантования использовалась imatrix из llama.cpp. Имя квантованного файла: gemma-4-26B-A4B-it-IQ4_NL.gguf, размер — 14.70 GB. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить