OpenRouter nomeia vários representantes: DeepSeek V4 Flash entra com preço ultrabaixo em fluxos agentic reais, GLM 5.2 assume o trono da qualidade como primeiro lugar na avaliação Artificial Analysis, NVIDIA Nemotron 3 Ultra representa a equipa americana completamente aberta. (Resumo anterior: Contagem decrescente para o fim da era de preços elevados da IA? Cinco razões estruturais pelas quais os tokens inevitavelmente baixarão de preço) (Contexto adicional: Anthropic bloqueia totalmente a China! Empresas de capital chinês, dentro e fora do país, proibidas de usar Claude, erguendo uma linha de defesa de segurança nacional) Índice deste artigo Alternar

DeepSeek leva o preço ao chão
GLM assume o trono da qualidade
Equipa americana: NVIDIA Nemotron 3 Ultra Há dois anos, o trono dos pesos abertos pertencia ainda ao Llama da Meta. Agora, os dados do maior router de LLM neutro do mundo, OpenRouter, mostram: Llama caiu completamente fora da lista. Em maio de 2026, os modelos de pesos abertos chineses já consumiam cerca de 61% dos tokens na plataforma, só a DeepSeek ocupou 17,6% numa única semana. Por trás desta inversão de cenário, há um facto subestimado: a inteligência e capacidade dos modelos de pesos abertos mantêm-se estáveis três a seis meses atrás dos laboratórios de ponta americanos, e esta diferença não está a aumentar. Para qualquer organização que analise as suas faturas de cloud, transferir cargas de trabalho de modelos de ponta para pesos abertos representa uma poupança real.

DeepSeek leva o preço ao chão

DeepSeek V4 Flash é o primeiro modelo de pesos abertos que foi diretamente colocado pela equipa em fluxos agentic reais, usado como substituto de modelos de ponta de nível Anthropic ou OpenAI. A versão maior V4 Pro obteve 80,6% no SWE-bench Verified, a pontuação mais alta entre pesos abertos (SWE-bench Verified, em termos simples, é um conjunto de tarefas reais de correção de código do GitHub para testar se o modelo sabe programar). DeepSeek V4-Pro

Taxa de entrada sem cache: 0.30 USD por milhão de tokens
Taxa de entrada com cache: 0.03 USD por milhão de tokens
Taxa de saída: 0.50 USD por milhão de tokens DeepSeek R1 (Especialista em raciocínio profundo e pensamento)
Taxa de entrada sem cache: 0.55 USD por milhão de tokens
Taxa de entrada com cache: 0.14 USD por milhão de tokens
Taxa de saída: 2.19 USD por milhão de tokens DeepSeek V4-Flash (Primeira escolha para velocidade extrema e baixo custo)
Taxa de entrada sem cache: 0.14 USD por milhão de tokens
Taxa de entrada com cache: 0.0028 USD por milhão de tokens
Taxa de saída: 0.28 USD por milhão de tokens Cache hit significa: quando o mesmo prompt ou histórico de conversa é inserido repetidamente, a taxa de entrada reduz-se significativamente em 70% a 90%.

GLM assume o trono da qualidade

O modelo aberto GLM 5.2, lançado pela z-ai em meados de junho, foi classificado como primeiro lugar em pesos abertos pelo Intelligence Index v4.1 da entidade de avaliação terceira Artificial Analysis, com 51 pontos, à frente dos 48 pontos do Nemotron 3 Ultra, dos 44 pontos do MiniMax M3 e do DeepSeek V4 Pro, e apenas cerca de cinco pontos abaixo do Claude Fable 5, que é fechado. Na avaliação agentic GDPval-AA, mais próxima de cenários reais, está aproximadamente ao nível do GPT-5.5. O seu ponto forte é o planeamento. Design de arquitetura, reestruturação à escala do repositório inteiro, tarefas agentic de longo prazo que correm muito tempo, o GLM 5.2 é atualmente a alternativa portátil mais próxima do estilo Opus. O custo é que gosta muito de pensar: preço real ponderado médio no OpenRouter de 0.447 USD de entrada por milhão de tokens, 3.31 USD de saída. O que é ainda mais intrigante é o timing. Poucos dias antes da chegada do GLM 5.2, uma ordem de controlo de exportação dos EUA forçou a Anthropic a desativar amplamente o Fable 5 e o Mythos 5 para impedir o acesso de cidadãos estrangeiros. De um lado, modelos fechados que são interrompidos de repente por razões geopolíticas; do outro, pesos abertos com licença MIT, próximos da fronteira, que qualquer um pode auto-hospedar.

Equipa americana: NVIDIA Nemotron 3 Ultra

Os pesos abertos não vêm apenas da China; a NVIDIA lançou recentemente o Nemotron 3 Ultra, que obteve 48 pontos na mesma lista, sendo o peso aberto americano mais forte, apenas atrás do GLM 5.2. 550 mil milhões de parâmetros, 55 mil milhões ativos, arquitetura mista Mamba-2 e Transformer, licenciado sob OpenMDW; OpenMDW, em termos simples, significa que não só são disponibilizados os pesos, como também os dados de treino, a receita e as ferramentas de avaliação são de código aberto. A lógica da NVIDIA é clara: quanto mais modelos abertos forem usados, mais chips Blackwell, CUDA e serviços empresariais para executar esses modelos serão vendidos.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
SKHynixTopsKOSPIByMarketCap
1,64M Popularidade
#
MicronEarningsBeatExpectationsSharesRise
354,15K Popularidade
#
IsraelStrikesIranBTCPlunges
65,31K Popularidade
#
PredictWorldCupShare20000U
129,14K Popularidade
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
196,24K Popularidade

Fixado

OpenRouter: A diferença de IA entre a China e os EUA é de apenas 3 a 6 meses, e os modelos de código aberto estão a varrer o mundo.

DeepSeek leva o preço ao chão

GLM assume o trono da qualidade

Equipa americana: NVIDIA Nemotron 3 Ultra

Tópicos em destaque

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fixado