Segundo o monitoramento do Beating, o agregador de serviços OpenRouter revelou que a diferença de desempenho entre modelos de código aberto e modelos de ponta fechados já se estabilizou em 3 a 6 meses. Nos últimos 18 meses, os laboratórios fechados de ponta não conseguiram aumentar a distância como esperado, enquanto as forças de código aberto representadas por novos players da China e dos EUA estão acelerando a substituição de modelos fechados com relação custo-benefício extremamente alta.

O DeepSeek V4 Flash, lançado há apenas dois meses, já se tornou a primeira escolha para substituição. Com 284 bilhões de parâmetros, o DeepSeek V4 Flash alcançou 79,0% no benchmark SWE-bench Verified, desempenho próximo ao nível do GPT-5.5. O preço oficial de entrada/saída de primeira parte é de apenas US$ 0,14/0,28 por milhão de tokens, com custo de saída cerca de 150 vezes mais barato que o GPT-5.5. Mesmo considerando o prêmio de hospedagem em nuvem ocidental que não retém dados para treinamento, o custo real fica em torno de 1,3% dos modelos fechados de ponta.

Além da vantagem de preço, o GLM 5.2, lançado pela Zhipu em junho de 2026, ficou em primeiro lugar no índice de inteligência de pesos abertos do Artificial Analysis e, em avaliações de agentes reais, se igualou ao nível do GPT-5.5, tornando-se uma alternativa para programação de longo prazo e planejamento. No entanto, o GLM 5.2 consome mais tokens durante o raciocínio profundo, exigindo que as empresas equilibrem os custos de saída ao implantá-lo. Já o modelo multimodal de código aberto MiniMax M3, com sua inovadora arquitetura de atenção esparsa MSA, oferece capacidade de processamento de contexto longo para imagens e vídeos nativos a um preço de token baixo, tornando-se um forte concorrente de código aberto para o Gemini Flash.

Ao mesmo tempo, o Nemotron 3 Ultra da NVIDIA, baseado na arquitetura híbrida Mamba-2, tornou-se a força de código aberto mais forte dos EUA, visando impulsionar a demanda do mercado de hardware e microsserviços da NVIDIA por meio de um ecossistema aberto.

A OpenRouter enfatiza que, embora os modelos fechados de ponta continuem avançando, o custo por token para um nível fixo de inteligência continuará diminuindo, oferecendo às empresas oportunidades significativas de otimização de custos.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
SKHynixTopsKOSPIByMarketCap
1,64M Popularidade
#
MicronEarningsBeatExpectationsSharesRise
485,66K Popularidade
#
IsraelStrikesIranBTCPlunges
64,84K Popularidade
#
PredictWorldCupShare20000U
127,06K Popularidade
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
193,53K Popularidade

Fixado

sitemap

Análise: A diferença entre modelos grandes de código aberto e a fronteira de código fechado entre China e EUA é de apenas 3 a 6 meses, e o custo extremamente baixo acelera a tendência global de substituição.

Tendências

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fixado