Futuros
Acesse centenas de contratos perpétuos
CFD
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
CFD
Derivativos de CFD de ações dos EUA
Ações dos EUA
Acesse ações e ETFs reais dos EUA
Ações de Hong Kong
Negocie ações de qualidade listadas em Hong Kong
Ações da Coreia
SK Hynix
Negocie ações da Coreia reais e invista em ativos populares
Futuros de ações
Alta alavancagem, negociação 24/7
Ações tokenizadas
Respaldado por ativos de ações reais
IPO Access
Desbloqueie o acesso completo a IPO de ações globais
GUSD
Cunhe GUSD para rendimentos de RWA do Tesouro
Atividades de ações
Negocie ações populares e desbloqueie airdrops generosos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
IPO Access
Desbloqueie o acesso completo a IPO de ações globais
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Centro de riqueza VIP
Planos premium de crescimento de patrimônio
Gate Wealth
Assuma o controle do seu futuro financeiro
Fundo Quantitativo
Estratégias quant de alto nível
Apostar
Faça staking de criptomoedas para ganhar em produtos PoS
Alavancagem Inteligente
Alavancagem sem liquidação
USD1 8% a.a.
Sem bloqueio, negocie e saque
Promoções
Centro de atividade
Participe de atividades e ganhe recompensas
Indicação
20 USDT
Convide amigos para recompensas de ind.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Anúncio
Atualizações na plataforma em tempo real
Blog da Gate
Artigos do setor de criptomoedas
Serviços VIP
Grandes Descontos nas Taxas
Gerenciamento de ativos
Solução completa de gerenciamento de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicativos da Gate
Transferência Bancária OTC
Deposite e retire moedas fiat
Programa de corretoras
Mecanismos de grandes descontos via API
AI
Gate AI
Seu parceiro de IA conversacional para todas as horas
Gate AI Bot
Use o Gate AI diretamente no seu aplicativo social
GateClaw
Gate Blue Lobster, pronto para usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
10K+ habilidades
Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA
Fim iminente da era de preços altos da IA? Cinco razões estruturais para a queda inevitável dos tokens.
Melhorias de desempenho com retornos decrescentes, custo de modelos de código aberto é apenas um décimo, chips dedicados reduzem drasticamente os custos de inferência, custo zero de troca permite que usuários mudem instantaneamente, modelos locais podem acabar com o modelo de assinatura em 4 a 5 anos. O espaço para grandes empresas de IA manterem preços altos está diminuindo rapidamente?
(Notícia anterior: Modelo principal da OpenAI, GPT-5.6 Sol, chega exclusivamente ao Cerebras, "Anão de cabelo branco" Serenity grita "tecnologia validada" e entra para comprar na baixa) (Complemento: Citrini Research: Evite a bolha da IA! Nomeia "5 áreas cegas de lucros exorbitantes" para receber rotação de capital)
Índice deste artigo
Toggle
O engenheiro de software Aditya Patadia aponta em seu blog pessoal: a Uber queimou todo o orçamento anual de IA em 4 meses, e Microsoft, Salesforce e GitHub também anunciaram que irão controlar os gastos de IA de seus funcionários. Isso já é um problema comum em toda a indústria, não uma questão de disciplina financeira de empresas individuais. Mas ele prevê que a cara estrutura de preços das principais empresas de IA atuais está prestes a sofrer uma reversão.
O duplo ataque do teto de desempenho e do código aberto
Primeira observação de Patadia: as melhorias no desempenho dos modelos estão com retornos decrescentes. Cada iteração do modelo ainda traz progresso, mas a magnitude do progresso está diminuindo, e o problema dos dados de treinamento é estrutural. Os principais laboratórios de IA já digeriram quase todo o conhecimento escrito digitalizável da história humana, e continuar melhorando o conjunto de treinamento é extremamente difícil.
Ele cita como evidência que Claude Opus 4.8 e Claude Opus 4.7 têm o mesmo preço: quando o modelo não consegue mais mostrar saltos significativos entre gerações, a justificativa para aumentar o preço desaparece, e a concorrência só terá um caminho: reduzir preços.
A segunda pressão vem do campo do código aberto. Ele usa GLM-5.2 como exemplo, um modelo de código aberto que já rivaliza com GPT 5.5 e Claude Opus em testes de referência de código, mas com preço de apenas um décimo do GPT 5.5, criando uma vantagem esmagadora de preço.
O julgamento de Patadia é: enquanto os modelos de código aberto continuarem reduzindo a diferença de desempenho em relação aos modelos fechados principais, o espaço para precificação dos modelos fechados continuará sendo comprimido.
Revolução dos chips e custo zero de troca
Outra linha de pressão sobre os preços de IA vem do hardware. Patadia aponta que chips dedicados de IA desenvolvidos por empresas como Cerebras, Groq e Google estão reescrevendo o limite inferior dos custos de inferência. Com o Google TPU, por exemplo, o custo de inferência é 30% a 70% mais barato que o da GPU Nvidia H100.
Simplificando, com a mesma quantidade de computação, usar o chip certo pode economizar muito dinheiro, e essa diferença comprime diretamente o limite inferior de preços dos provedores de serviços de modelo. Além dos chips, a própria arquitetura do modelo também está reduzindo custos: o mecanismo de cache permite que consultas repetidas não precisem ser recalculadas, e a arquitetura MoE (Mixture of Experts), em termos simples, permite que o modelo chame apenas alguns "especialistas" conforme necessário, sem precisar mobilizar todos os neurônios a cada vez, reduzindo significativamente os custos computacionais enquanto mantém a precisão equivalente.
E há um ponto que Patadia considera o fator estrutural mais subestimado: o custo zero de troca.
Sua comparação é direta: o fosso de softwares tradicionais como Windows, Adobe e Salesforce está no alto custo de substituí-los, muitas vezes exigindo meses de migração; os modelos de IA não têm esse fosso. Serviços de gateway de IA como OpenRouter.ai permitem que desenvolvedores troquem de provedor de modelo em segundos, e até mesmo programar o sistema para alternar automaticamente entre diferentes provedores.
Quando concorrentes podem ser substituídos instantaneamente, qualquer tentativa de aumento de preço por parte de um fabricante resultará na perda direta de usuários.
Modelos locais: a ameaça final ao modelo de assinatura
A previsão mais ousada de Patadia aponta para modelos locais. Sua estimativa é de 4 a 5 anos: o aumento contínuo do desempenho dos chips combinado com a inevitável queda nos preços da memória RAM permitirá que computadores de nível consumidor e smartphones executem modelos de linguagem localmente. Ele prevê ainda que os sistemas operacionais principais incorporarão interfaces de implantação de modelos, permitindo que aplicativos locais chamem modelos locais diretamente.
Se esse cenário se concretizar, o que isso significa? Os modelos em nuvem só serão necessários para as tarefas mais complexas: análise de documentos legais, inferência de contexto longo, integração entre bancos de dados. Tarefas cotidianas como autocompletar código, revisão de arquivos, verificação básica de fatos serão realizadas localmente, sem necessidade de assinatura mensal de nuvem de $20 ou até $200.
Claro, Patadia também observa que isso é uma "previsão" e não um fato confirmado. Ele declara que são suas "apostas ousadas", e o tempo dará a resposta. Mas as cinco direções de pressão acima – retornos decrescentes de desempenho, ascensão de alternativas de código aberto, redução de custos com chips dedicados, custo zero de troca, substituição por modelos locais – todas já têm casos reais que as sustentam, não são meros experimentos mentais.
Se a previsão de Patadia estiver correta, isso é bom para os usuários; mas para as empresas de IA que cobram, é outra história.