DeepSeek reduz preços de API em 90%, executa V4 em chips Huawei e impulsiona a inferência de IA para uma guerra de preços total


A DeepSeek cortou os preços da API em 90% nas acções de cache de entrada e está a oferecer um desconto de 75% no V4-Pro até 5 de Maio
Isso leva o preço de cache-hit do V4-Pro para cerca de $0,0036 por milhão de tokens, enquanto o preço de saída fica muito abaixo dos modelos ocidentais de fronteira que cobram $12–$25 por milhão de tokens
O V4-Pro tem 1,6T de parâmetros totais, com 49B ativos por passagem de inferência. O V4-Flash é a versão menor com 284B de parâmetros
O V4 funciona em chips Huawei Ascend, não NVIDIA
Também usa muito menos computação. Com uma janela de contexto de 1 milhão de tokens, o V4-Pro supostamente precisa de apenas 27% da computação requerida pelo V3.2
O desempenho ainda está ligeiramente atrás do GPT-5.4 e Gemini 3.1 Pro
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar