Vercel: O volume de chamadas de tokens do DeepSeek ultrapassa o do OpenAI, representando apenas 1% do custo total

robot
Geração do resumo em andamento
ME AI Mensagem, de acordo com o monitoramento Beating, a Vercel lançou o índice de produção AI Gateway de junho de 2026. O relatório mostra que, graças à série DeepSeek V4 (incluindo os modelos Flash e Pro) lançada na Vercel Gateway em maio, a participação de tokens do DeepSeek aumentou de menos de 1% para 17% em um mês, superando a OpenAI (13%) e ficando em terceiro lugar. No entanto, devido ao preço extremamente baixo, o custo total de uso do DeepSeek por todos os usuários representa apenas cerca de 1% do gasto total de fundos na gateway. O preço é o principal motivo pelo qual o DeepSeek explodiu rapidamente. A cobrança por milhão de tokens de entrada e saída do DeepSeek V4 Flash é de apenas 0,14 dólares e 0,28 dólares, respectivamente, sendo 20 a 50 vezes mais barato que modelos de ponta semelhantes da Anthropic, e 8 a 12 vezes mais barato que o Qwen 3.6 Plus e Kimi K2.6. Avaliações indicam que o desempenho do DeepSeek V4 atende aos padrões, incentivando a equipe de desenvolvimento a implantar rapidamente em produção. Apesar do aumento no volume de modelos de baixo custo, os modelos de ponta ainda dominam em termos de consumo de fundos. Em maio, a participação de gastos da Anthropic aumentou de 61% para 65%, representando entre 70% e 80% dos gastos em cenários de geração de aplicações, agentes de backend e programação. Por exemplo, no cenário de agentes de programação, o DeepSeek contribuiu com 49% do volume de tokens, mas representou apenas 4% dos custos, enquanto a Anthropic consumiu 28% do volume de tokens e 70% do orçamento. A equipe de desenvolvimento está gerenciando o orçamento por meio de roteamento inteligente, desviando tarefas de alta frequência e baixo risco para modelos de baixo custo, usando modelos de ponta apenas em pontos críticos. A consideração do retorno sobre o investimento (ROI) também desacelera a atualização dos modelos. Por exemplo, o Google lançou em maio o Gemini 3.5 Flash, cujo preço é superior ao da versão 3.0, resultando em uma migração lenta; no final do mês, o 3.0 Flash ainda representava 90% do volume da série Flash, enquanto o 3.5 Flash tinha apenas 7%. Além disso, os agentes de IA demonstram uma densidade de consumo de tokens extremamente alta, consumindo mais da metade dos tokens com apenas um quarto do volume de solicitações. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado