Чипы Huawei замедляют запуск DeepSeek V4? Тот же самый движок поддерживает и NVIDIA, и Ascend, и ускоряет почти в 2 раза.

robot
Генерация тезисов в процессе
ME News消息,4月24日(UTC+8),据动察Beating监测,DeepSeek V4发布前,社区广泛流传一种猜测:V4上线时间晚于预期,是因为模型从英伟达迁移到华为昇腾平台遭遇适配困难。V4技术报告虽未直接回应这一传闻,但披露的性能数据与之明显矛盾。 报告显示,V4的细粒度专家分区方案(Fine-Grained EP Scheme)已在NVIDIA GPU和华为昇腾NPU双平台完成部署验证,常规推理负载加速1.50至1.73倍,RL rollout和高速Agent服务等延迟敏感场景最高加速1.96倍。团队已将CUDA版本内核MegaMoE作为DeepGEMM的一部分开源。换言之,V4在两套硬件上都跑出了接近理论上限的效率,跨平台适配并未造成性能折损。 (来源:BlockBeats)
DEEPSEEK-2,58%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено