Разреженная архитектура MoE, 25 миллиардов активных параметров — экономия вычислительных ресурсов ощущается в каждом аспекте

Посмотреть Оригинал
CoinNetwork
Cohere открытый исходный код Command A+:218B параметров MoE крупная модель, ориентированная на корпоративных агентов и суверенитет данных
Cohere официально открыл исходный код модели разреженного гибридного эксперта Command A+ с 218 миллиардов параметров, использующую лицензию Apache 2.0, ориентированную на корпоративных агентов и приватное развертывание, с акцентом на суверенитет данных и физическую изоляцию. Полный объем 218B, активируется 25B при одном выводе; работает на двух H100 или одной B200, Hugging Face предоставляет версии с низкой точностью, такие как W4A4. Command A+ изначально поддерживает мультимодальный ввод, 128K контекстных данных для входа, 64K длина вывода, предназначен для сложных задач вывода, вызова автономных инструментов, запросов к базам данных и рабочих процессов с длинными документами, поддерживает 48 языков (включая официальные языки ЕС).
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено