Análise: A diferença entre os grandes modelos de código aberto da China e dos EUA e a vanguarda de código fechado é de apenas 3 a 6 meses, e o custo extremamente baixo acelera a tendência global de substituição.

robot
Geração de resumo em curso

De acordo com a monitorização do Beating, o agregador de serviços OpenRouter revelou que a diferença de desempenho entre modelos de código aberto e modelos de ponta fechados estabilizou em 3 a 6 meses. Nos últimos 18 meses, os laboratórios de ponta fechados não conseguiram aumentar a distância como esperado, enquanto as forças de código aberto representadas por novos intervenientes da China e dos EUA estão a acelerar a substituição dos modelos fechados com uma relação custo-benefício extremamente elevada.

O DeepSeek V4 Flash tornou-se a primeira escolha para substituição apenas dois meses após o seu lançamento. Com 284 mil milhões de parâmetros, o DeepSeek V4 Flash obteve 79.0% no benchmark SWE-bench Verified, com desempenho próximo do nível GPT-5.5. O preço oficial de entrada/saída de primeira parte é de apenas 0.14/0.28 dólares por milhão de tokens, sendo o custo de saída cerca de 150 vezes mais barato que o GPT-5.5. Mesmo com o prémio de alojamento em nuvem ocidental que não retém dados de treino, o custo real é apenas cerca de 1.3% dos modelos de ponta fechados.

Além das vantagens de preço, o GLM 5.2, lançado pela Zhipu em junho de 2026, ficou em primeiro lugar no Artificial Analysis Open-Source Weight Intelligence Index e, em avaliações de agentes reais, equipara-se ao nível GPT-5.5, tornando-se uma alternativa para programação de longo curso. No entanto, o GLM 5.2 consome muitos tokens durante o pensamento profundo, exigindo um equilíbrio nos custos de saída para implementação empresarial. O modelo multimodal de código aberto MiniMax M3, com a sua inovadora arquitetura de atenção dispersa MSA, oferece capacidades de processamento de contexto longo para imagens e vídeos nativos a um preço de token baixo, tornando-se um forte concorrente de código aberto para o Gemini Flash.

Entretanto, o Nemotron 3 Ultra da NVIDIA, baseado na arquitetura híbrida Mamba-2, tornou-se a força de código aberto mais forte nos EUA, com o objetivo de impulsionar a procura do mercado para o ecossistema de hardware e microsserviços da NVIDIA através de um ecossistema aberto.

A OpenRouter sublinha que, embora os modelos de ponta fechados continuem a avançar, o custo dos tokens para um nível fixo de inteligência continuará a diminuir, proporcionando às empresas um espaço significativo para otimização de custos.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado