OpenClaw fez com que a empresa de modelos experimentasse pela primeira vez os benefícios da economia de Token.


17 de junho, GLM-5.2 de código aberto. Desta vez, diferente.
Licença MIT: modifique à vontade, venda à vontade, única obrigação manter a declaração de direitos autorais.
Risco de propriedade intelectual zerado, empresas podem integrar modelos em seus produtos comerciais sem preocupações, mesmo após modificações.
Em contraste com licenças como GPL, que exigem que qualquer código derivado seja também aberto, MIT elimina barreiras.
Mais importante ainda — todos os modelos, a partir de agora, entram na era do raciocínio prolongado.
O que exatamente mudou com o GLM-5.2?
Na era OpenClaw, o trabalho do Agente era "corrida de curta distância" — cada tarefa tinha uma janela limitada, planejamento-execução-encerramento, o tamanho do cache KV era controlado, a pressão de hardware era principalmente de poder de processamento.
O raciocínio de longo prazo do GLM-5.2 é uma "maratona" — contexto de 1 milhão de tokens sem perdas, o modelo pode manter todo o código, todo o histórico de decisões, todas as restrições em uma única tarefa.
Nos testes reais, processou quase 88 mil tokens de uma só vez, quase preenchendo toda a janela.
O que essa mudança significa?
No passado, IA era "pergunta e resposta", o consumo de tokens terminava após uma consulta.
Após o GLM-5.2, o Agente começa a realizar tarefas realmente de longo prazo: decompor objetivos → planejamento em múltiplas rodadas → validação contínua → ajuste de ferramentas → escrever código e executar → replanejar com base no feedback.
Uma única tarefa pode disparar centenas de ciclos de raciocínio.
Cada ciclo precisa carregar o contexto completo na memória para recalcular.
Cálculo contínuo, comunicação contínua, leitura e escrita contínuas.
Esses três "continuar" mudaram completamente a lógica de precificação de hardware.
Raciocínio de longo prazo do Agente, afinal, beneficia o quê?
🥇 HBM
O cache KV cresce linearmente com o número de rodadas de diálogo e comprimento do contexto, esgotando rapidamente a capacidade de HBM da GPU.
Quando o cache KV sai da GPU, a largura de banda cai de nível de TB/s para centenas de GB/s — o problema passa de "poder de processamento" para "largura de banda de memória".
Três grandes fabricantes com capacidade esgotada, déficit de 50%-60%, mercado de 2026 avaliado em 54,6 bilhões de dólares.
🥈 Chips de luz/InP
O raciocínio de longo prazo roda em clusters, cada ciclo requer sincronização entre nós.
Quanto mais longa a tarefa, mais ciclos, maior o volume de comunicação.
Módulos de luz terão mercado de 26 bilhões de dólares em 2026, crescimento anual de 60%.
Déficit de substrato InP de mais de 70%, preço do índio subiu 90% em relação ao ano anterior.
🥉 CPU
Tarefas de longo prazo exigem contínua decomposição de tarefas, chamadas de ferramentas, gerenciamento de fluxo, agendamento de cache KV.
Essas tarefas não são bem feitas por GPU, dependem de CPU.
Proporção CPU/GPU de 1:8 se aproxima de 1:1, o CEO da Intel declarou publicamente que "várias empresas estão ligando para acelerar o fornecimento de CPUs".
❄️ Refrigeração líquida
Raciocínio curto é carga de pulso, raciocínio longo é carga contínua total.
A mesma placa, o consumo real de energia de tarefas de longo prazo é 3-5 vezes maior que o de raciocínio curto.
Consumo do rack sobe de 36 kW para 200 kW, arrefecimento a ar não aguenta, refrigeração líquida passa de "alternativa" para "necessária".
🔌 Switch
A demanda de largura de banda do cluster de raciocínio sobe de 100G para 400G, dezenas de milhares de placas precisam de gerenciamento.
IB e Ethernet de alta velocidade beneficiam-se totalmente.
📦 Placa de substrato ABF
Clusters passam de mil para dez mil placas, cada chip precisa ser encapsulado.
Monopólio da Mitsui com mais de 90% de filmes ABF, déficit de 42% em 2028.
O preço da farinha sobe, o pão só vai ficar mais caro.
🧪 CCL M9
Placas-mãe e backplanes do cluster de raciocínio precisam de substratos de alta velocidade.
O preço do M9 é 10 vezes o de FR4 comum, mercado de CCL de IA de 18,7 bilhões de dólares em 2027, crescimento superior ao dos módulos ópticos.
OpenClaw acendeu a chama, o GLM-5.2 fornece a lenha.
Primeiro, fez as empresas de modelos ganharem seu primeiro Token, agora, esse mercado sai do laboratório e entra na indústria.
Operações simples ainda permanecem na memória, na luz, desfrutando da bolha de IA.
$MU $SKHYNIX $LITE
TOKEN3,06%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado