Por que o "modelo de assinatura de serviços de IA" está destinado a desaparecer?

Question

Título original: 《Por que o serviço de assinatura de IA está condenado a desaparecer?》Autor original: Zhang Yongyi, Geek Park

Autor original:律动BlockBeats

Fonte original:

Reprodução: Mars Finance

O sistema de assinatura será esvaziado, valorize enquanto pode.

9 de junho, Anthropic lançou seu modelo público mais avançado até agora, o Claude Fable 5. Como de costume, deveria ser um dia de celebração para os assinantes — o dinheiro que você paga todo mês finalmente lhe dá acesso ao flagship em primeira mão.

Mas uma linha no anúncio imediatamente gerou grande controvérsia: após 22 de junho, o Fable 5 será removido de todos os planos de assinatura, e o uso contínuo exigirá compra separada de pontos de uso.

Em outras palavras, mesmo que você seja assinante, o modelo flagship só estará disponível por 14 dias.

Um modelo que, no dia do lançamento, já traz uma "ordem de saída", é uma novidade na indústria de grandes modelos.

Muitos consideraram isso um erro da Anthropic, ou uma demonstração de arrogância. Minha opinião é exatamente o oposto: isso não é um erro, é um aviso.

O sistema de assinatura de IA está caminhando para uma morte inevitável — não por ganância de alguma empresa, mas porque o próprio pressuposto que sustenta o sistema de assinatura está sendo destruído pelas próprias IA.

01 Contagem regressiva: 14 dias para o modelo flagship

Vamos esclarecer os fatos. Segundo o cronograma oficial da Anthropic (9 de junho de 2026), o Fable 5, desde o lançamento, estará disponível gratuitamente nos planos Pro, Max, Team e empresarial por assinatura por assento, até 22 de junho; a partir de 23 de junho, ele será removido desses planos, e cada token adicional será cobrado a partir de pontos pré-pagos, com tarifas iguais às da API.

Essa tarifa não é barata: US$10 por milhão de tokens de entrada, US$50 por milhão de tokens de saída, exatamente o dobro do flagship anterior, o Opus 4.8. Ainda mais sutil, é que durante o período gratuito, o Fable 5 também conta aproximadamente o dobro de peso na cota de assinatura — ou seja, a velocidade de consumo de créditos é o dobro do Opus.

A reação dos usuários era previsível. No Hacker News, alguém afirmou que essa prática de "dar primeiro, cobrar depois" é preocupante, suspeitando que a Anthropic queira empurrar os assinantes para cobrança por uso; outros desenvolvedores testaram e descobriram que uma única sessão de programação com um agente no plano Max de US$100 por mês consome tokens no valor de quase cem dólares.

E isso não é exclusividade da Anthropic. Nas últimas oito semanas, toda a indústria tem feito o mesmo: a OpenAI, em 2 de abril, mudou a cobrança do Codex de por mensagem para por token na API, expandindo depois para todos os clientes empresariais existentes.

A GitHub, em 20 de abril, congelou novas inscrições no Copilot para usuários individuais, uma semana depois anunciou a mudança para cobrança por Créditos de IA, concluída em 1º de junho — plano Pro por US$10 ao mês, com créditos de US$10 incluídos.

As ações da Anthropic foram mais intensas: a partir de 4 de abril, proibiu o uso de frameworks de agentes de terceiros como OpenClaw, mudando para cobrança por uso; em 21 de abril, a página de preços do plano Pro do Claude Code foi silenciosamente marcada com um X vermelho, e após uma reação da comunidade, foi retirada em 24 horas, com explicação oficial de "teste com cerca de 2% dos novos usuários"; em 14 de maio, anunciou oficialmente que, a partir de 15 de junho, SDK de agentes e chamadas sem interface seriam removidos do pool de assinaturas, passando a ser medidos por tarifa de API e pontos independentes.

Três empresas, oito semanas, um mesmo rumo — isso não é coincidência, é a resposta de toda a indústria a uma mesma questão matemática.

Como é essa questão?

02 O preço nunca foi baseado em poder de processamento

A instituição de pesquisa SemiAnalysis colocou essa questão na mesa recentemente. Eles compraram uma assinatura de cada plano da Anthropic e da OpenAI, rodaram tarefas de programação de longo prazo até esgotar a cota semanal, e converteram o uso em valor de mercado com base na tarifa da API: quanto valem esses usos?

Antes, a percepção geral era que um pacote de US$200 por mês suportava cerca de US$2000 em tokens. Mas os testes mostraram resultados muito superiores: Claude Pro de US$20, com limite de cerca de US$400; Max 20x de US$200, cerca de US$8000.

Na OpenAI, o exagero foi ainda maior — ChatGPT Plus de US$20 consegue gerar cerca de US$700, Pro 20x de US$200, cerca de US$14.000.

Duas observações justas antes: esses valores representam o limite de uso "cheio", não o nível de uso diário de um usuário comum; as tarifas da API incluem margem de lucro, e os números convertidos não refletem necessariamente o custo real de processamento.

Porém, o preço deve sempre cobrir o limite superior — como uma seguradora que não pode assumir riscos sem limites.

Subsídios em si não são fatais. Subsidiar streaming, subsídios em aplicativos de transporte, gastar dinheiro para crescer — tudo isso é tradição na internet. O que realmente é fatal é que há uma diferença fundamental entre o sistema de assinatura de IA e esses modelos.

Netflix consegue vender assinatura mensal porque o custo marginal de colocar um filme a mais na plataforma é quase zero, e uma pessoa tem no máximo 24 horas por dia para assistir. Spotify funciona do mesmo jeito. A premissa implícita do sistema de assinatura é que o consumo é limitado pelo limite fisiológico do usuário — o que realmente se precifica não é o conteúdo, mas o tempo da pessoa.

Na era dos chatbots, a IA se encaixa parcialmente nessa premissa. Uma pessoa pode conversar bastante, mas seu tempo de digitação por dia é limitado; créditos ociosos de usuários leves são suficientes para cobrir o consumo excessivo de usuários pesados.

Depois, veio o agente.

Como é uma tarefa de agente? Ele lê 20 arquivos, faz planejamento, altera código, roda testes, lê erros, itera — e, em uma rodada, consome de 5 a 30 vezes mais tokens do que uma conversa comum. E o pior: ele não precisa de sua presença.

Tenho minha própria experiência: há pouco, pedi a um agente que organizasse dados de voos de dois aeroportos. Fui tomar banho, voltei e a tarefa já tinha acabado, os créditos quase no limite. Você dorme, a conta continua rodando.

O que o agente cancela não é o limite de preço, mas o limite de consumo. E toda a evolução da indústria de IA — tarefas mais longas, maior autonomia, múltiplas instâncias paralelas — está correndo na direção do mesmo destino:

Remover completamente o usuário do ciclo de consumo.

A GitHub deixou claro em seu anúncio que o uso de agentes "está se tornando padrão". Ou seja, o cenário em que a assinatura ainda faz sentido — onde a pessoa senta na frente da tela e conversa frase por frase — é cada vez menor na visão do valor da IA.

E aí, alguém pode perguntar: se a subsidiação é tão profunda, por que não aumentar os preços?

Já tentaram, e chegaram a uma conclusão pior. Olhando para a tabela do SemiAnalysis, há um detalhe estranho: quanto mais caro o plano, maior a multiplicação do subsídio.

No caso do Claude, US$20 de assinatura equivalem a 20 vezes o subsídio, US$200, 40 vezes; na OpenAI, de 35 para 70 vezes. Metade disso é pelo próprio desenho de precificação — planos mais caros ampliam a cota por múltiplos, como um desconto para grandes clientes; a outra metade é pelo comportamento do usuário — quem paga US$200 por um pacote 20x é porque quer usar até o limite, usuários leves não aparecem nesses planos.

Na indústria de seguros, isso tem um nome: seleção adversa. Quando uma apólice atrai apenas os segurados de maior risco, ela perde sentido atuarial. Qualquer preço fixo acaba filtrando exatamente quem usa mais do que o limite — isso não é um problema operacional, é uma questão estrutural, e ajustar preços só vai aprofundar a seleção.

Durante todo 2025, a indústria tentou várias soluções. Em janeiro, Sam Altman admitiu no X que o ChatGPT Pro de US$200 por mês estava operando no prejuízo, por uso além do esperado — a tentativa de aumentar preços falhou.

No meio do ano, a Cursor mudou a cobrança de por solicitação para por poder de processamento, causando uma grande quantidade de cancelamentos, e o CEO pediu desculpas publicamente — a mudança de regras no meio do caminho fracassou; no verão, a Anthropic adicionou limites semanais ao Claude Code, alegando que alguns usuários rodavam agentes 24 horas por dia, consumindo poder de processamento de dezenas de milhares de dólares — o controle de fluxo só gerou raiva.

Depois que todas as soluções falharam, veio a grande confissão dos últimos oito semanas. Nick Turley, chefe do ChatGPT na OpenAI, deixou claro no podcast BG2: "Na era atual, oferecer planos ilimitados é como oferecer energia ilimitada."

03 A casca ainda existe, o núcleo morreu

Claro, há uma resposta forte: o sistema de assinatura ainda funciona bem. ChatGPT Plus continua por US$20 ao mês, Claude Pro ainda é vendido, e o GitHub mantém a assinatura de código. Será que a ideia de extinção é exagero?

Essa resposta merece atenção, porque o fenômeno descrito é real. Mas ela erra na leitura do que realmente morreu.

A alma do sistema de assinatura nunca foi o "pagamento mensal", mas a promessa de "preço fixo, uso tranquilo" — você não precisa calcular o custo de cada uso, e isso foi a principal vantagem que permitiu sua vitória sobre o pagamento por uso.

O que está acontecendo agora é que o ciclo de cobrança permanece, mas a promessa foi retirada.

No plano de US$10 do GitHub Pro, o que há são créditos de US$10, que se esgotam — isso não é assinatura, é uma pré-pagamento disfarçado de assinatura. Os créditos da Anthropic são debitados por tarifa API, os da OpenAI suportam recarga automática. O sistema de assinatura não desaparece, ele é esvaziado: a casca permanece, o núcleo morreu.

Ainda há uma verdadeira área de proteção: o chat puro. Ainda é possível pagar por mês porque é o último cenário em que o consumo de IA ainda é limitado pelo tempo da pessoa. Mas essa barreira não é suficiente para proteger o setor — cada centavo investido em pesquisa e desenvolvimento está empurrando a IA do "responda às perguntas" para o "ajude ativamente a fazer".

A assinatura de chat não será eliminada, ela será marginalizada: permanecerá, observando que o verdadeiro valor e a verdadeira receita estão sendo lentamente transferidos para um mundo de cobrança por uso.

Outro detalhe difícil de ignorar é uma coincidência temporal: segundo o TechCrunch (junho de 2026), no lançamento do Fable 5, a Anthropic estaria se preparando para uma oferta pública ao lado da OpenAI. Nos últimos três anos, subsídios foram pagos por capital de risco; investidores do mercado aberto não aceitariam uma demonstração de prejuízo por cada usuário pesado adicional. A agenda de saída do capital determinará que a batalha final não será adiada indefinidamente.

Para diferentes pessoas, isso significa coisas distintas. Para as empresas, os gastos com IA precisarão ser gerenciados como gastos em nuvem — segundo o The Information, o CTO da Uber, em memorando interno, disse que a empresa gastou em quatro meses o orçamento anual de IA de 2026, e que fazer orçamentos, monitorar e roteirizar modelos por tarefa será uma habilidade obrigatória para todos.

Para os usuários, antes, os leves subsidiavam os pesados; agora, cada um paga sua própria conta de energia.

Honestamente, nem tudo é ruim nisso. Com o retorno do sinal de preço, "vale a pena fazer IA para essa tarefa?" torna-se uma questão real — e quando uma indústria começa a responder seriamente a essa pergunta, é sinal de que ela está saindo do ciclo de gastos desenfreado e entrando na fase de negócios normais.

Para concluir, quero fazer uma observação: antes que a conta de energia seja instalada, o sistema de assinatura atual talvez seja o momento mais generoso que esse setor já ofereceu ao usuário — use, valorize.

A lógica está na própria tabela do SemiAnalysis. Do ponto de vista do usuário, ela não é uma sentença de morte, mas uma lista de benefícios ainda em vigor: você paga US$200 por mês, e a plataforma gasta até US$14.000 em poder de processamento.

Esse nível de subsídio só foi visto na guerra do táxi e na guerra de delivery — e todos lembramos como terminaram essas batalhas: após o fim dos subsídios, os preços nunca mais voltaram ao nível anterior.

Portanto, é melhor aproveitar enquanto pode. Como o Fable 5 só estará na assinatura até 22 de junho, ao invés de esperar pelo momento de calcular tudo na era dos pontos, é melhor planejar tarefas longas que você sempre quis fazer, mas achava caro. Isso não é um golpe, é um beneficiário consciente de um erro de precificação que está prestes a ser corrigido.

A metáfora de Turley talvez seja mais profunda do que ele quis dizer. O verdadeiro marco de que a energia virou infraestrutura não é ela chegar às casas, mas que cada uma tenha um medidor — a partir daquele momento, ninguém discute mais "energia por assinatura", só o preço.

O sistema de assinatura não terá um obituário. Ele simplesmente se transformará, em um dia de fatura silenciosa, em uma linha na sua conta de gastos chamada "taxa de entrada".

Antes disso — use, valorize.

Por que o "modelo de assinatura de serviços de IA" está destinado a desaparecer?

Tendências

MyGateTradeStory

TradFiCFDGoldMaster

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

USIranPeaceDealReachedStraitOfHormuzToOpen

Fixado