¿"El chip de Huawei retrasa el lanzamiento de DeepSeek V4"? El mismo núcleo funciona tanto con NVIDIA como con Ascend y acelera casi 2 veces.

robot
Generación de resúmenes en curso
ME News mensaje, 24 de abril (UTC+8), según el monitoreo de Dongcha Beating, antes del lanzamiento de DeepSeek V4, se difundió ampliamente en la comunidad una especulación: que el retraso en la fecha de lanzamiento de V4 se debía a dificultades de adaptación al migrar el modelo de NVIDIA a la plataforma Huawei Ascend. Aunque el informe técnico de V4 no respondió directamente a este rumor, los datos de rendimiento divulgados contradicen claramente esta afirmación. El informe muestra que el esquema de partición de expertos de grano fino (Fine-Grained EP Scheme) de V4 ha sido verificado en ambas plataformas, NVIDIA GPU y Huawei Ascend NPU, logrando una aceleración de 1.50 a 1.73 veces en cargas de inferencia convencionales, y hasta 1.96 veces en escenarios sensibles a la latencia como el rollout de RL y servicios de agente de alta velocidad. El equipo ha publicado como código abierto el kernel en versión CUDA MegaMoE como parte de DeepGEMM. En otras palabras, V4 alcanzó una eficiencia cercana al límite teórico en ambos conjuntos de hardware, y la adaptación multiplataforma no causó pérdida de rendimiento. (Fuente: BlockBeats)
DEEPSEEK-2,58%
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado