bartowski опубликовал файл GGUF для квантования IQ4_NL на базе Gemma-4 26B-A4B-it MoE

robot
Генерация тезисов в процессе

ME News: Сообщение, 4 апреля (UTC+8). Недавно пользователь @outsource_ опубликовал сообщение о том, что выпущен квантованный GGUF-файл IQ4_NL на основе модели Google Gemma-4 26B-A4B-it MoE. Итого модель содержит примерно 26 миллиардов параметров, а активируется около 4 миллиардов параметров. Квантованный файл был сделан bartowski; он использовал imatrix из llama.cpp для доработки и квантования. Название квантованного файла: gemma-4-26B-A4B-it-IQ4_NL.gguf, размер — 14.70 GB. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить