Por que a «assinatura de serviços de IA» está destinada a desaparecer?

Título original: 《Por que o modelo de assinatura de IA está condenado a desaparecer?》Autor original: Zhang Yongyi, Geek Park

Autor original:律动BlockBeats

Fonte original:

Reprodução: Mars Finance

O modelo de assinatura será esvaziado, e deve ser valorizado enquanto dura.

9 de junho, Anthropic lançou seu modelo público mais avançado até agora, Claude Fable 5. Como de costume, deveria ser um dia de celebração para os assinantes — o dinheiro que você paga todo mês finalmente lhe dá acesso ao flagship na hora.

Mas uma linha no anúncio imediatamente gerou grande controvérsia após a publicação: após 22 de junho, o Fable 5 será removido de todos os planos de assinatura, e o uso contínuo exigirá compra separada de pontos de uso.

Em outras palavras, mesmo que você seja assinante, o modelo flagship só estará disponível por 14 dias.

Um modelo que, no dia do lançamento, já traz uma “ordem de saída”, é uma novidade na indústria de grandes modelos.

Muitos consideraram isso um erro da Anthropic, ou uma demonstração de arrogância. Minha opinião é exatamente o oposto: isso não é um erro, é um aviso.

O modelo de assinatura de IA está caminhando para uma morte inevitável — não por ganância de alguma empresa, mas porque o próprio pressuposto que sustenta o sistema de assinatura está sendo destruído pelas próprias IA.

01 Contagem regressiva: 14 dias para o modelo flagship

Vamos esclarecer os fatos. Segundo o cronograma oficial da Anthropic (9 de junho de 2026), o Fable 5, desde o lançamento, estará disponível gratuitamente nos planos Pro, Max, Team e empresarial por assinatura por assento, até 22 de junho; a partir de 23 de junho, ele será removido desses planos, e cada token adicional será descontado dos pontos pré-pagos, com tarifas idênticas às da API.

Essa tarifa não é barata: US$10 por milhão de tokens de entrada, US$50 por milhão de tokens de saída, exatamente o dobro do flagship anterior, Opus 4.8. Ainda mais sutil, é que mesmo durante o período gratuito, o Fable 5 conta aproximadamente o dobro de peso na cota de assinatura — ou seja, a velocidade de consumo de pontos é o dobro da de Opus.

A reação dos usuários foi previsível. No Hacker News, alguém afirmou que essa “prática de dar primeiro e cobrar depois” é preocupante, suspeitando que a Anthropic queira empurrar os assinantes para cobrança por uso; outros desenvolvedores testaram e descobriram que, em um plano Max de US$100 por mês, uma única sessão de programação com um agente consumia tokens no valor de quase US$100.

E isso não é uma ação exclusiva da Anthropic. Nas últimas oito semanas, toda a indústria tem feito o mesmo: a OpenAI, em 2 de abril, mudou a cobrança do Codex de por mensagem para por token na API, expandindo depois para todos os clientes empresariais existentes.

No dia 20 de abril, o GitHub congelou novas inscrições no Copilot para usuários individuais, e uma semana depois anunciou a mudança para cobrança por Créditos de IA, concluída em 1º de junho — plano Pro por US$10 ao mês, com US$10 em pontos incluídos.

As ações da Anthropic foram mais intensas: a partir de 4 de abril, proibiu o uso de frameworks de agentes de terceiros como OpenClaw, mudando para cobrança por uso; em 21 de abril, a página de preços do plano Pro do Claude Code foi silenciosamente marcada com um X vermelho, e após uma reação forte da comunidade, foi retirada em 24 horas, com a explicação oficial de “teste para cerca de 2% dos novos usuários”; em 14 de maio, anunciou oficialmente que, a partir de 15 de junho, o SDK de agentes e chamadas sem interface seriam removidos do pool de assinaturas, passando a ser medidos por tarifa de API e pontos independentes.

Três empresas, oito semanas, um mesmo rumo — isso não é coincidência, é a resposta de toda a indústria a uma mesma questão matemática.

Como é essa questão?

02 O preço nunca foi baseado em poder de processamento

A instituição de pesquisa SemiAnalysis colocou essa questão na mesa recentemente. Eles compraram uma assinatura de cada plano da Anthropic e da OpenAI, rodaram tarefas de programação de longo prazo até esgotar a cota semanal, e converteram o uso em valor monetário com base na tarifa da API: quanto valem esses usos?

Antes, a percepção geral era que um plano de US$200 por mês suportava cerca de US$2.000 em tokens. Mas os testes mostraram resultados muito superiores: Claude Pro de US$20, por exemplo, tinha um limite de cerca de US$400; Max 20x de US$200, cerca de US$8.000.

Na OpenAI, os números são ainda mais impressionantes — ChatGPT Plus de US$20 consegue gerar cerca de US$700, e Pro 20x de US$200, cerca de US$14.000.

Duas observações justas: esses valores representam o limite de uso “até o limite máximo”, não o consumo diário típico de usuários comuns; e as tarifas da API incluem margem de lucro, portanto esses números não refletem exatamente o custo real de processamento.

Porém, o preço deve garantir o limite superior — como uma seguradora que não pode assumir riscos sem limites.

Subsídios não são fatais por si só. Subsidiar streaming, subsídios em aplicativos de transporte, gastar dinheiro para crescer — tudo isso é estratégia antiga na internet. O que realmente é fatal, é que o sistema de assinatura de IA tem uma diferença fundamental.

Netflix consegue vender assinatura mensal porque o custo marginal de adicionar um filme é quase zero, e uma pessoa só tem 24 horas por dia para assistir. Spotify funciona do mesmo jeito. A premissa implícita do modelo mensal é que o consumo é limitado pelo limite fisiológico — o que realmente se precifica não é o conteúdo, mas o tempo das pessoas.

Na era dos chatbots, a IA se encaixa nessa premissa. Uma pessoa pode conversar bastante, mas seu limite diário de digitação é finito; a cota de uso ociosa de usuários leves é suficiente para cobrir o consumo excessivo de usuários pesados.

Depois, veio o agente.

Como é uma tarefa de agente? Ele lê 20 arquivos, faz planejamento, altera código, roda testes, lê erros, itera — uma rodada consome de 5 a 30 vezes mais tokens do que uma conversa comum. E o pior: ele não precisa de sua presença.

Tenho experiência própria: há pouco, pedi a um agente que organizasse dados de voos de dois aeroportos. Fui tomar banho, voltei e a tarefa já tinha acabado, e minha cota quase no limite. Você dorme, e a conta de consumo continua girando.

O que o agente faz é remover o limite de consumo, não o de preço. E toda a evolução da indústria de IA — tarefas mais longas, maior autonomia, múltiplas instâncias paralelas — está correndo na mesma direção: tirar o ser humano do ciclo de consumo.

A GitHub deixou claro na sua comunicação que o uso de agentes “está se tornando padrão”. Ou seja, o cenário em que a assinatura ainda faz sentido — onde as pessoas sentam na frente da tela e conversam frase por frase — vai encolher cada vez mais na visão do valor da IA.

E aí, alguém pode perguntar: se a subsidiação é tão profunda, por que não aumentar os preços?

Já tentaram, e chegaram a uma conclusão pior. Olhando de novo para a tabela do SemiAnalysis, há um detalhe estranho: quanto mais caro o plano, maior a multiplicação do subsídio.

No caso do Claude, US$20 de assinatura equivalem a 20 vezes o subsídio, enquanto o plano de US$200 tem uma multiplicação de 40 vezes; na OpenAI, de 35 para 70 vezes. Metade disso é por design de precificação — planos mais caros ampliam a cota por múltiplos, como um desconto para grandes clientes; a outra metade é comportamento do usuário — quem paga US$200 por um plano de 20x, é porque quer usar até o limite, e os usuários leves não aparecem nesses planos.

Na indústria de seguros, isso tem um nome: seleção adversa. Quando uma apólice de seguro atrai apenas os segurados de maior risco, ela perde sentido atuarial. Qualquer preço fixo vai filtrar exatamente quem usa mais do que o limite — isso não é um problema operacional, é uma questão estrutural, e reajustar preços só vai aprofundar o problema.

Durante todo 2025, a indústria tentou várias soluções. Em janeiro, Sam Altman admitiu no X que o ChatGPT Pro de US$200 por mês dava prejuízo, pois o uso superava as expectativas — a tentativa de aumentar preços fracassou.

No meio do ano, a Cursor mudou a cobrança de por solicitação para por poder de processamento, causando uma grande quantidade de cancelamentos, e o CEO pediu desculpas publicamente — a mudança de regras foi um fracasso; no verão, a Anthropic adicionou limites semanais ao Claude Code, alegando que alguns usuários ficavam o dia todo com agentes rodando, consumindo poder de processamento de dezenas de milhares de dólares — o controle de fluxo só gerou raiva.

Depois que todas as soluções falharam, veio a confrontação definitiva nas últimas oito semanas. Nick Turley, responsável pelo ChatGPT na OpenAI, deixou claro no podcast BG2: “No cenário atual, oferecer planos ilimitados é como oferecer energia ilimitada.”

03 A casca ainda existe, o núcleo morreu

Claro, há uma resposta forte: o sistema de assinatura ainda funciona bem. ChatGPT Plus continua por US$20 ao mês, Claude Pro ainda é vendido, e o GitHub mantém a assinatura de código. Então, a ideia de que está morrendo é alarmismo?

Essa resposta merece atenção, porque o fenômeno descrito é real. Mas ela erra na análise do que realmente morreu.

A essência do sistema de assinatura nunca foi o “pagamento mensal”, mas a promessa de “preço fixo, uso tranquilo” — você não precisa calcular o custo de cada uso, e isso foi a principal vantagem frente ao pagamento por uso.

O que está acontecendo agora é que o ciclo de cobrança permanece, mas a promessa foi retirada.

No plano de US$10 do GitHub Pro, o que há são pontos de US$10, usados até acabar — não é assinatura, é uma recarga pré-paga com aparência de assinatura. Os pontos da Anthropic são descontados pela tarifa da API, e os da OpenAI suportam recarga automática. O sistema de assinatura não desaparece, ele é esvaziado: a casca permanece, o núcleo morreu.

Ainda há uma verdadeira área de proteção: o chat puro. Ele ainda pode ser mensal porque é o último cenário de IA onde o consumo ainda é limitado pelo tempo das pessoas. Mas essa barreira não é inquebrável — cada centavo investido em pesquisa e desenvolvimento na indústria empurra a IA do “responda o que eu pergunto” para o “ajude-me a fazer”.

A assinatura de chat não será eliminada, mas será marginalizada: ficará no lugar, enquanto o verdadeiro valor e a verdadeira receita migram lentamente para o mundo do pagamento por uso.

Outro detalhe difícil de ignorar é uma coincidência temporal: segundo o TechCrunch (junho de 2026), na ocasião do lançamento do Fable 5, a Anthropic estaria preparando uma oferta pública junto com a OpenAI. Nos últimos três anos, subsídios foram pagos por capital de risco; investidores do mercado aberto não aceitariam uma demonstração de prejuízo “a cada usuário pesado adicional”. A agenda de saída do capital determinará que a confrontação não será adiada indefinidamente.

Para diferentes atores, isso significa coisas distintas. Para as empresas, os gastos com IA precisarão ser gerenciados como gastos em nuvem — segundo o The Information, o CTO da Uber, em memorando interno, disse que a empresa gastou em quatro meses o orçamento anual de IA de 2026, e que fazer orçamentos, monitorar e roteirizar modelos por tarefa será uma habilidade obrigatória para todos.

Para os usuários, antes os leves subsidiavam os pesados; agora, cada um paga sua própria conta de energia.

Honestamente, isso pode não ser uma coisa ruim. Com o retorno do sinal de preço, “vale a pena fazer IA para essa tarefa?” torna-se uma questão real — e quando uma indústria começa a responder seriamente a essa pergunta, é sinal de que ela está deixando de queimar dinheiro e entrando na fase de negócios normais.

Aqui, quero fazer uma observação: antes que o consumo de energia seja totalmente medido, o sistema de assinatura atual talvez seja o momento mais generoso que essa indústria já ofereceu ao usuário — use, e valorize.

A lógica está na tabela do SemiAnalysis. Do ponto de vista do usuário, ela não é uma sentença de morte, mas uma lista de benefícios ainda em vigor: você paga US$200 por mês, e a plataforma queima até US$14.000 em poder de processamento.

Esse nível de subsídio só foi visto na guerra de táxis e na guerra de delivery — e todos sabemos como terminaram essas guerras: após o fim dos subsídios, os preços nunca mais voltaram ao que eram.

Portanto, é hora de fazer o que precisa ser feito. Como, por exemplo, manter o Fable 5 na assinatura até 22 de junho. Em vez de esperar pelo momento em que os pontos se tornem a norma, é melhor aproveitar para planejar tarefas longas que você sempre quis fazer, mas achava caro. Não é um golpe, é um beneficiário consciente de um erro de precificação que está prestes a ser corrigido.

A metáfora de Turley talvez seja mais profunda do que ele quis dizer. O verdadeiro marco de que a energia virou infraestrutura não é ela chegar às casas, mas que cada casa tenha um medidor — a partir daquele momento, ninguém discute “energia por assinatura”, só o preço da energia.

O sistema de assinatura não terá um obituário. Ele apenas se transformará, em um dia de fatura silencioso, numa linha de “taxa de entrada” na sua lista de despesas.

Antes disso — use, valorize.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado