「O chip da Huawei atrasa o lançamento do DeepSeek V4」? O mesmo núcleo é compatível com Nvidia e Ascend e acelera quase 2 vezes.

robot
Geração do resumo em andamento

ME News消息,4月24日(UTC+8),据动察Beating监测,DeepSeek V4发布前,社区广泛流传一种猜测:V4上线时间晚于预期,是因为模型从英伟达迁移到华为昇腾平台遭遇适配困难。V4技术报告虽未直接回应这一传闻,但披露的性能数据与之明显矛盾。报告显示,V4的细粒度专家分区方案(Fine-Grained EP Scheme)已在NVIDIA GPU和华为昇腾NPU双平台完成部署验证,常规推理负载加速1.50至1.73倍,RL rollout和高速Agent服务等延迟敏感场景最高加速1.96倍。团队已将CUDA版本内核MegaMoE作为DeepGEMM的一部分开源。换言之,V4在两套硬件上都跑出了接近理论上限的效率,跨平台适配并未造成性能折损。(来源:BlockBeats)

NOTÍCIAS ME, 24 de abril (UTC+8), de acordo com o monitoramento do Beating, antes do lançamento do DeepSeek V4, circularam amplamente na comunidade especulações de que o atraso no lançamento do V4 era devido a dificuldades de adaptação ao migrar o modelo da NVIDIA para a plataforma Huawei Ascend. Embora o relatório técnico do V4 não tenha respondido diretamente a esse rumor, os dados de desempenho divulgados o contradizem claramente. O relatório mostra que o esquema de particionamento fino de especialistas (Fine-Grained EP Scheme) do V4 já foi implantado e validado em ambas as plataformas, GPU NVIDIA e NPU Huawei Ascend, com aceleração de 1,50 a 1,73 vezes em cargas de inferência comuns, e de até 1,96 vezes em cenários sensíveis à latência, como rollout de RL e serviços de agente de alta velocidade. A equipe disponibilizou como código aberto o kernel MegaMoE da versão CUDA como parte do DeepGEMM. Em outras palavras, o V4 alcançou eficiência próxima ao limite teórico em ambos os hardwares, e a adaptação entre plataformas não causou perda de desempenho. (Fonte: BlockBeats)

DEEPSEEK-2,58%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado