Cambricon ha completado la adaptación de DeepSeek-V4, el código ya está abierto al público, impulsando la fortaleza de las acciones de chips nacionales

robot
Generación de resúmenes en curso

Según el monitoreo de Beating, Cambricon anunció que el mismo día del lanzamiento de V4 completó la adaptación de dos modelos, 285B DeepSeek-V4-Flash y 1.6T DeepSeek-V4-Pro, basados en el marco de inferencia vLLM, y el código de adaptación ya está abierto en GitHub.

La velocidad de adaptación depende de dos premisas: primero, que el stack de software NeuWARE desarrollado por Cambricon soporte nativamente marcos principales como PyTorch y vLLM, permitiendo una migración rápida del modelo; segundo, que los chips de Cambricon soporten nativamente formatos de datos de baja precisión, sin necesidad de conversión adicional de formatos para verificar la precisión. Para la nueva estructura de V4, Cambricon ha acelerado módulos específicos como Compressor y mHC mediante su biblioteca de operadores fusionados Torch-MLU-Ops, y ha escrito núcleos de operadores calientes como Atención dispersa/compresión y GroupGemm en BangC.

En el nivel del marco de inferencia, Cambricon soporta en vLLM la paralelización híbrida de cinco dimensiones TP/PP/SP/DP/EP, paralelización de comunicación y cálculo, cuantificación de baja precisión y despliegue separado de PD. El informe técnico de V4 solo menciona la validación en GPU de NVIDIA y NPU de Huawei Ascend, sin incluir la plataforma de Cambricon; esta adaptación fue realizada de forma autónoma por Cambricon. Impulsada por la noticia del lanzamiento de V4, la sección de chips nacionales en A-shares se fortaleció, y Cambricon experimentó un aumento directo en el mercado durante la sesión.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado