OpenRouter: A diferença de IA entre a China e os EUA é de apenas 3 a 6 meses, e os modelos de código aberto estão a varrer o mundo.

OpenRouter nomeia vários representantes: DeepSeek V4 Flash entra com preço ultrabaixo em fluxos agentic reais, GLM 5.2 assume o trono da qualidade como primeiro lugar na avaliação Artificial Analysis, NVIDIA Nemotron 3 Ultra representa a equipa americana completamente aberta. (Resumo anterior: Contagem decrescente para o fim da era de preços elevados da IA? Cinco razões estruturais pelas quais os tokens inevitavelmente baixarão de preço) (Contexto adicional: Anthropic bloqueia totalmente a China! Empresas de capital chinês, dentro e fora do país, proibidas de usar Claude, erguendo uma linha de defesa de segurança nacional) Índice deste artigo Alternar

  • DeepSeek leva o preço ao chão
  • GLM assume o trono da qualidade
  • Equipa americana: NVIDIA Nemotron 3 Ultra Há dois anos, o trono dos pesos abertos pertencia ainda ao Llama da Meta. Agora, os dados do maior router de LLM neutro do mundo, OpenRouter, mostram: Llama caiu completamente fora da lista. Em maio de 2026, os modelos de pesos abertos chineses já consumiam cerca de 61% dos tokens na plataforma, só a DeepSeek ocupou 17,6% numa única semana. Por trás desta inversão de cenário, há um facto subestimado: a inteligência e capacidade dos modelos de pesos abertos mantêm-se estáveis três a seis meses atrás dos laboratórios de ponta americanos, e esta diferença não está a aumentar. Para qualquer organização que analise as suas faturas de cloud, transferir cargas de trabalho de modelos de ponta para pesos abertos representa uma poupança real.

DeepSeek leva o preço ao chão

DeepSeek V4 Flash é o primeiro modelo de pesos abertos que foi diretamente colocado pela equipa em fluxos agentic reais, usado como substituto de modelos de ponta de nível Anthropic ou OpenAI. A versão maior V4 Pro obteve 80,6% no SWE-bench Verified, a pontuação mais alta entre pesos abertos (SWE-bench Verified, em termos simples, é um conjunto de tarefas reais de correção de código do GitHub para testar se o modelo sabe programar). DeepSeek V4-Pro

  • Taxa de entrada sem cache: 0.30 USD por milhão de tokens
  • Taxa de entrada com cache: 0.03 USD por milhão de tokens
  • Taxa de saída: 0.50 USD por milhão de tokens DeepSeek R1 (Especialista em raciocínio profundo e pensamento)
  • Taxa de entrada sem cache: 0.55 USD por milhão de tokens
  • Taxa de entrada com cache: 0.14 USD por milhão de tokens
  • Taxa de saída: 2.19 USD por milhão de tokens DeepSeek V4-Flash (Primeira escolha para velocidade extrema e baixo custo)
  • Taxa de entrada sem cache: 0.14 USD por milhão de tokens
  • Taxa de entrada com cache: 0.0028 USD por milhão de tokens
  • Taxa de saída: 0.28 USD por milhão de tokens Cache hit significa: quando o mesmo prompt ou histórico de conversa é inserido repetidamente, a taxa de entrada reduz-se significativamente em 70% a 90%.

GLM assume o trono da qualidade

O modelo aberto GLM 5.2, lançado pela z-ai em meados de junho, foi classificado como primeiro lugar em pesos abertos pelo Intelligence Index v4.1 da entidade de avaliação terceira Artificial Analysis, com 51 pontos, à frente dos 48 pontos do Nemotron 3 Ultra, dos 44 pontos do MiniMax M3 e do DeepSeek V4 Pro, e apenas cerca de cinco pontos abaixo do Claude Fable 5, que é fechado. Na avaliação agentic GDPval-AA, mais próxima de cenários reais, está aproximadamente ao nível do GPT-5.5. O seu ponto forte é o planeamento. Design de arquitetura, reestruturação à escala do repositório inteiro, tarefas agentic de longo prazo que correm muito tempo, o GLM 5.2 é atualmente a alternativa portátil mais próxima do estilo Opus. O custo é que gosta muito de pensar: preço real ponderado médio no OpenRouter de 0.447 USD de entrada por milhão de tokens, 3.31 USD de saída. O que é ainda mais intrigante é o timing. Poucos dias antes da chegada do GLM 5.2, uma ordem de controlo de exportação dos EUA forçou a Anthropic a desativar amplamente o Fable 5 e o Mythos 5 para impedir o acesso de cidadãos estrangeiros. De um lado, modelos fechados que são interrompidos de repente por razões geopolíticas; do outro, pesos abertos com licença MIT, próximos da fronteira, que qualquer um pode auto-hospedar.

Equipa americana: NVIDIA Nemotron 3 Ultra

Os pesos abertos não vêm apenas da China; a NVIDIA lançou recentemente o Nemotron 3 Ultra, que obteve 48 pontos na mesma lista, sendo o peso aberto americano mais forte, apenas atrás do GLM 5.2. 550 mil milhões de parâmetros, 55 mil milhões ativos, arquitetura mista Mamba-2 e Transformer, licenciado sob OpenMDW; OpenMDW, em termos simples, significa que não só são disponibilizados os pesos, como também os dados de treino, a receita e as ferramentas de avaliação são de código aberto. A lógica da NVIDIA é clara: quanto mais modelos abertos forem usados, mais chips Blackwell, CUDA e serviços empresariais para executar esses modelos serão vendidos.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado