Vercel:O volume de chamadas de tokens do DeepSeek ultrapassa o da OpenAI, representando apenas 1% do custo total

robot
Geração de resumo em curso
ME AI Mensagem, de acordo com o monitoramento de Batimentos, a Vercel lançou o índice de produção AI Gateway de junho de 2026. O relatório mostra que, graças à série DeepSeek V4 (incluindo os modelos Flash e Pro) lançada na Vercel Gateway em maio, a participação de tokens do DeepSeek aumentou de menos de 1% para 17% em um mês, ultrapassando a OpenAI (13%) e ficando em terceiro lugar. No entanto, devido ao preço extremamente baixo, o custo total de uso do DeepSeek por todos os usuários representa apenas cerca de 1% do gasto total de fundos da gateway. O preço é a principal razão para a rápida explosão do DeepSeek. A cobrança por milhão de tokens de entrada e saída do DeepSeek V4 Flash é de apenas 0,14 dólares e 0,28 dólares, respectivamente, sendo 20 a 50 vezes mais barato que modelos de ponta semelhantes da Anthropic, e 8 a 12 vezes mais barato que o Qwen 3.6 Plus e Kimi K2.6. Avaliações indicam que o desempenho do DeepSeek V4 atende aos padrões, incentivando a equipe de desenvolvimento a implantar rapidamente em produção. Apesar do aumento de tráfego de modelos de baixo custo, os modelos de ponta ainda dominam em consumo de fundos. Em maio, a participação de gastos da Anthropic aumentou de 61% para 65%, representando entre 70% e 80% dos gastos em cenários de geração de aplicações, agentes de backend e programação. Por exemplo, no cenário de agentes de programação, o DeepSeek contribuiu com 49% do tráfego de tokens, mas representou apenas 4% dos custos, enquanto a Anthropic, com 28% do tráfego, consumiu 70% dos fundos. A equipe de desenvolvimento está gerenciando o orçamento por meio de roteamento inteligente, desviando tarefas de alta frequência e baixo risco para modelos de baixo custo, usando modelos de ponta apenas em pontos críticos. A consideração do retorno sobre o investimento (ROI) também desacelera a atualização dos modelos. Por exemplo, o lançamento do Gemini 3.5 Flash pela Google em maio, com preço superior ao da versão 3.0, resultou em uma migração lenta, e no final do mês, o 3.0 Flash ainda representava 90% do tráfego da série Flash, enquanto o 3.5 Flash tinha apenas 7%. Além disso, os agentes de IA demonstram uma densidade de consumo de tokens extremamente alta, consumindo mais da metade dos tokens com apenas um quarto das solicitações. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado