DeepSeek-V4-Flash se lanza en Huawei Cloud

El 24 de abril, el modelo DeepSeek-V4 fue lanzado oficialmente y de código abierto, con adaptación exclusiva para Huawei Cloud.
Para DeepSeek-V4, la adaptación exclusiva para Huawei Cloud utiliza un mecanismo de compresión de atención en capas, que logra una gestión eficiente de la asignación de KVCache bajo el mecanismo de atención V4, ofreciendo más de 10 operadores de fusión de alto rendimiento de Ascend como TopK, SWA, CFA, etc., combinados con optimizaciones de marco como programación asíncrona y especulación de múltiples pasos MTP, soportando inferencias de alto rendimiento con contexto nativo de 1M.
Actualmente, la plataforma de modelos como servicio (MaaS) de Huawei Cloud ya proporciona a los desarrolladores un servicio de Tokens que permite llamar a la API DeepSeek-V4-Flash sin despliegue y con un solo clic.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado