bartowski опубликовал файл GGUF для квантования IQ4_NL на базе Gemma-4 26B-A4B-it MoE

robot
Генерация тезисов в процессе

Сообщение ME News: 4 апреля (UTC+8). В последнее время пользователь @outsource_ сообщил, что был выпущен квантованный GGUF-файл IQ4_NL на основе модели Google Gemma-4 26B-A4B-it MoE. Общий объем модели составляет около 260 млрд параметров, при этом активируется около 4 млрд параметров. Квантованный файл подготовлен bartowski; для доработки и квантования использовалась imatrix из llama.cpp. Имя квантованного файла: gemma-4-26B-it-IQ4_NL.gguf, размер — 14.70 GB. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить