Loflly: Por trás da subscrição do Claude que põe o lagostim fora de jogo, o verdadeiro caminho não é um token ainda mais barato

robot
Geração de resumo em curso

(Fonte: Máquina do Coração)

Máquina do Coração Redacção

Na era dos agentes, precisamos de uma correcta filosofia de cobrança e de design de engenharia — foi esta a opinião agora publicada por Roffly, responsável pelos modelos de grande dimensão da Xiaomi MiMo, na X.

Há poucos dias, divulgámos uma notícia — a Anthropic anunciou que, a partir de agora, utilizadores com subscrição do Claude Pro e do Max não podem mais usar as suas quotas de subscrição para frameworks de agentes de terceiros, como o OpenClaw. Queres continuar a usá-lo? Então terás de mudar para uma API com pagamento por consumo. Isto deixou muitos utilizadores do Claude, que estavam a brincar com “hummer” com subscrição, completamente confusos num instante.

A explicação oficial da Anthropic afirma que o modelo de preços baseado em subscrição foi originalmente concebido com base na “intensidade normal de utilização do utilizador individual”. No entanto, a intensidade de uso de ferramentas de agentes automatizados como o OpenClaw fica muito acima do esperado: utilizadores intensivos pagam apenas 200 dólares de subscrição por mês, mas consomem recursos de computação no valor de 5000 dólares, o que cria uma enorme pressão de custos para a Anthropic.

Assim que a notícia saiu, as reacções foram variadas: houve quem gritasse “fomos apunhalados pelas costas”, sentindo que o modelo de subscrição perdera de repente o seu atractivo; também houve quem aplaudisse, considerando que isto é uma forma de limpar o uso ineficiente e proteger a sustentabilidade de todo o ecossistema.

Independentemente do que se pensa, o problema central ficou exposto: o actual modelo de cobrança por tokens já é muito difícil de lidar com os desafios. Precisamos de formas mais inteligentes e sustentáveis de usar a capacidade de computação.

No post, Roffly apontou primeiro que a subscrição da Anthropic já estava a correr com prejuízo.

A subscrição do Claude Code é um sistema de distribuição de equilíbrio de capacidade de computação muito bem concebido. O meu parecer é — provavelmente não dá lucro, e mesmo pode estar a dar prejuízo, a menos que a margem de lucro da respectiva API seja 10-20 vezes maior, mas tenho dúvidas. Não consigo calcular com precisão a dimensão do prejuízo causado pela integração de frameworks de terceiros, mas observei de perto a gestão de context do OpenClaw — está mal escrita. Dentro de um único pedido de um utilizador, ele desencadeia múltiplas chamadas a ferramentas de baixo valor, e cada uma delas é emitida como uma requisição de API independente, levando também uma janela de contexto muito longa (muitas vezes superior a 100 mil tokens). Mesmo que haja “cache hit”, é extremamente desperdiçador; em casos extremos, ainda aumenta a taxa de “cache miss” das outras requisições.

Convertido em termos reais, o número de chamadas de API que cada pedido de um utilizador desencadeia é várias vezes superior ao do próprio framework do Claude Code. Ao traduzir isto para os preços de API, o custo real é provavelmente dezenas de vezes o preço da subscrição. Isto não é uma diferença — é um buraco.

Quanto à dor sentida pelos utilizadores com subscrição que foram cortados, ela acredita que esta dor, a longo prazo, tem benefícios: vai forçar o progresso de engenharia.

O OpenClaw, o OpenCode e outros frameworks de terceiros ainda podem chamar Claude através de API, apenas não podem mais “caronear” na subscrição. A curto prazo, estes utilizadores de agentes vão sentir muita dor — os custos saltam facilmente dezenas de vezes. Mas esta pressão, precisamente, é o que vai empurrar estes frameworks a melhorar seriamente a gestão do context, a maximizar as taxas de “prompt cache hit” para reutilizar o context já processado e a reduzir o consumo de tokens sem utilidade. A dor acabará por se transformar em disciplina de engenharia.

Ao mesmo tempo, ela emitiu um aviso, dizendo para as empresas de modelos de grande dimensão não entrarem numa guerra de preços cega: vender tokens a baixo preço e, em simultâneo, permitir que ferramentas de terceiros “paufem” é uma armadilha.

Quero aconselhar as empresas de modelos de grande dimensão: enquanto não tiverem pensado e decidido como definir os preços de subscrição para coding, de modo a não sofrerem perdas graves, não entrem impulsivamente na corrida até ao fundo dos preços. Vender tokens extremamente baratos e, ao mesmo tempo, abrir as portas aos frameworks de terceiros — à primeira vista parece amigável para os utilizadores, mas na prática é uma armadilha. A Anthropic acabou de sair desta armadilha. O problema mais profundo é este: se os utilizadores gastarem tempo e energia em frameworks de agentes de qualidade baixa, gastarem em serviços de inferência extremamente instáveis e lentos, gastarem em modelos “afundados” para reduzir custos, e no fim descobrirem que afinal não conseguem fazer nada — isto cria um ciclo vicioso tanto para a experiência do utilizador como para a retenção.

De seguida, ela também apresentou o MiMo Token Plan recentemente lançado pela Xiaomi e sublinhou que o que procuram é “entregar de forma estável e a longo prazo modelos e serviços de alta qualidade”.

Sobre o MiMo Token Plan — ele suporta a integração de frameworks de terceiros, com cobrança por quotas de tokens; a lógica é semelhante ao novo “extra usage package” lançado pela Claude. Como procuramos entregar de forma estável e a longo prazo modelos e serviços de alta qualidade — e não fazer com que pagues por impulso e depois abandonas o barco.

No fim, ela apontou que a oferta global de capacidade de computação já não consegue acompanhar a procura de tokens criada pelos agentes. A verdadeira saída não é ter tokens mais baratos, mas sim evolução coordenada — “frameworks de agentes que poupam mais tokens” × “modelos mais poderosos, mais eficazes e mais eficientes”. A acção da Anthropic, queiram ou não, está a empurrar todo o ecossistema — tanto open source como closed source — nessa direcção. Provavelmente, isto é uma boa coisa.

Quanto às opiniões de Roffly, a comunidade de programadores reagiu com força, e o foco das discussões rapidamente evoluiu de “a Anthropic está certa ou não” para alguns problemas ainda mais fundamentais:

1、Isto não é uma disputa de preços; é uma reescrita estrutural da economia da IA.

Tal como Roffly disse, o custo unitário dos serviços de IA nunca é determinado apenas pelo modelo em si; é determinado pela soma de “modelo × framework × gestão de context”. A acção da Anthropic, desta vez, criou inadvertidamente uma pressão de selecção natural sobre os frameworks de agentes.

Também houve quem dissesse directamente: o sinal que a iniciativa da Anthropic transmite de verdade é — a camada de orquestração é o produto, e não apenas o modelo. A tensão entre o modelo de subscrição e a cobrança por API é apenas um sintoma superficial dessa lógica mais profunda.

2、Não te apresses a criticar a definição de preços; primeiro vê como a capacidade de computação está a ser queimada.

O “desperdício de capacidade de computação” mencionado por Roffly encontrou forte ressonância entre quem trabalha no sector. Alguém disse com precisão: isto não é, de todo, uma questão de “IA demasiado cara”; é uma questão de “capacidade de computação a ser maltratada”. O desenho grosseiro dos frameworks, somado a uma grande janela de context e a chamadas redundantes desnecessárias, faz com que o dinheiro gasto não traga qualquer produção real.

Os insights mais profundos vieram de um programador, que apontou: as decisões de tratamento de context no Claude Code nunca foram “parâmetros por defeito”, mas sim julgamentos, trabalhados e refinados repetidamente, sobre o que manter, o que descartar e quando comprimir — decisões essas incorporadas na arquitectura. O que falta aos frameworks de terceiros não são funcionalidades; é essa opinião de engenharia embutida.

Outro programador confirmou isto com a própria experiência: no mês passado, gastou muito tempo a limpar lógica redundante na antiga camada de orquestração que tinha montado para clientes. “Limpar a confusão é muito mais trabalhoso do que montá-la inicialmente.”

3、A eliminação pelo mercado já começou, mas o desfecho ainda não está definido.

Roffly acredita que a pressão dos custos vai forçar a evolução dos frameworks, mas os programadores colocaram uma questão ainda mais dura: os frameworks de terceiros conseguem compensar a diferença de eficiência tempo suficiente e com rapidez, de modo a que a cobrança por API continue a fazer sentido economicamente? Ou a maioria dos utilizadores descobre que o custo é demasiado terrível e, simplesmente, volta por defeito ao Claude Code?

Estas duas rotas levam a ecossistemas completamente diferentes. Um programador acrescentou: o que os developers de frameworks realmente precisam não é um direito “incluído” de acesso à integração, mas sim limites claros e previsíveis das quotas de tokens. Limites nítidos criam comportamentos de produto melhores; zonas cinzentas pouco claras só criam confusão.

O post de Roffly é um sinal de evolução técnica muito com visão de futuro, e as discussões relacionadas atingiram também as dores centrais actuais da engenharia de software de IA. A partir daqui, resta ver como todo o mercado vai mudar de “queimar capacidade de computação de forma extensiva” para “arquitecturas de engenharia mais refinadas”.

Muita informação, análises precisas — tudo na aplicação Sina Finance

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar