Análise: A diferença entre modelos grandes de código aberto e a fronteira de código fechado entre China e EUA é de apenas 3 a 6 meses, e o custo extremamente baixo acelera a tendência global de substituição.

robot
Geração do resumo em andamento

Segundo o monitoramento do Beating, o agregador de serviços OpenRouter revelou que a diferença de desempenho entre modelos de código aberto e modelos de ponta fechados já se estabilizou em 3 a 6 meses. Nos últimos 18 meses, os laboratórios fechados de ponta não conseguiram aumentar a distância como esperado, enquanto as forças de código aberto representadas por novos players da China e dos EUA estão acelerando a substituição de modelos fechados com relação custo-benefício extremamente alta.

O DeepSeek V4 Flash, lançado há apenas dois meses, já se tornou a primeira escolha para substituição. Com 284 bilhões de parâmetros, o DeepSeek V4 Flash alcançou 79,0% no benchmark SWE-bench Verified, desempenho próximo ao nível do GPT-5.5. O preço oficial de entrada/saída de primeira parte é de apenas US$ 0,14/0,28 por milhão de tokens, com custo de saída cerca de 150 vezes mais barato que o GPT-5.5. Mesmo considerando o prêmio de hospedagem em nuvem ocidental que não retém dados para treinamento, o custo real fica em torno de 1,3% dos modelos fechados de ponta.

Além da vantagem de preço, o GLM 5.2, lançado pela Zhipu em junho de 2026, ficou em primeiro lugar no índice de inteligência de pesos abertos do Artificial Analysis e, em avaliações de agentes reais, se igualou ao nível do GPT-5.5, tornando-se uma alternativa para programação de longo prazo e planejamento. No entanto, o GLM 5.2 consome mais tokens durante o raciocínio profundo, exigindo que as empresas equilibrem os custos de saída ao implantá-lo. Já o modelo multimodal de código aberto MiniMax M3, com sua inovadora arquitetura de atenção esparsa MSA, oferece capacidade de processamento de contexto longo para imagens e vídeos nativos a um preço de token baixo, tornando-se um forte concorrente de código aberto para o Gemini Flash.

Ao mesmo tempo, o Nemotron 3 Ultra da NVIDIA, baseado na arquitetura híbrida Mamba-2, tornou-se a força de código aberto mais forte dos EUA, visando impulsionar a demanda do mercado de hardware e microsserviços da NVIDIA por meio de um ecossistema aberto.

A OpenRouter enfatiza que, embora os modelos fechados de ponta continuem avançando, o custo por token para um nível fixo de inteligência continuará diminuindo, oferecendo às empresas oportunidades significativas de otimização de custos.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários