DeepSeek-V4-Flash lançado na Huawei Cloud

Em 24 de abril, o modelo DeepSeek-V4 foi oficialmente lançado e de código aberto, com suporte inicial na Huawei Cloud.
Para o DeepSeek-V4, a Huawei Cloud lançou um mecanismo de compressão de atenção em camadas, que implementa uma gestão eficiente do KVCache sob o mecanismo de atenção V4, oferecendo mais de 10 operadores de fusão de alto desempenho, como TopK, SWA e CFA, combinados com otimizações de framework como agendamento assíncrono e previsão multi-passo MTP, suportando inferência de alto desempenho com contexto nativo de 1 milhão de tokens.
Atualmente, a plataforma de modelo como serviço (MaaS) da Huawei Cloud já fornece aos desenvolvedores um serviço de Tokens que permite chamar o DeepSeek-V4-Flash API com um clique, sem necessidade de implantação.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar