Quanto da taxa de assinatura que você paga ao Claude pode a empresa de módulos de luz obter?

TL;DR

· Gráfico de divisão de custos da assinatura de Claude 20 dólares, detalhando uma despesa mensal de IA repartida entre a empresa de modelos, computação em nuvem, GPU, eletricidade e cadeia de suprimentos.

· Assinaturas de IA têm custos contínuos de inferência, não podendo aplicar diretamente a suposição de alta margem de lucro de SaaS tradicional.

· Títulos relacionados: OpenAI, Anthropic, Microsoft, Amazon, Google, Nvidia (NVDA), TSMC, SK Hynix, Samsung, Micron, centros de dados e cadeia de energia.

Um gráfico que divide aproximadamente 20 dólares de pagamento mensal de Claude Pro nos EUA entre a empresa de modelos, computação em nuvem, depreciação de GPU, eletricidade e cadeia de suprimentos está levando investidores a reconsiderar como se deve avaliar a receita de aplicações de IA.

Este gráfico não é uma divisão oficial de receita de Anthropic, Amazon Cloud ou Nvidia, nem deve ser considerado como os registros financeiros reais de qualquer empresa. Seu valor está em levantar uma questão mais fundamental: quanto da assinatura paga pelo usuário às aplicações de IA pode, como no SaaS tradicional, se consolidar em margem de lucro de software?

A avaliação do SaaS tradicional é bastante clara. Após o desenvolvimento do software, vender mais uma conta geralmente tem custos adicionais baixos, e empresas maduras de software puro frequentemente apresentam margens de lucro de 70% ou até 80%. Investidores estão dispostos a pagar múltiplos elevados porque, à medida que a receita cresce, há potencial para a margem de lucro continuar a subir.

O problema das aplicações de IA é que, toda vez que o usuário faz uma pergunta, escreve código, analisa um arquivo ou chama um agente, há consumo de tempo de GPU, eletricidade, largura de banda de memória e recursos em nuvem. Apesar de parecer uma taxa fixa mensal, na base há uma cadeia de custos que varia com o uso. Usuários leves podem ter alta margem, enquanto usuários intensivos, que operam dentro de limites de uso ou pacotes de ferramentas, podem ver seus custos subir rapidamente.

Portanto, o gráfico de divisão de 20 dólares não questiona tanto quanto uma empresa retém de cada dólar, mas sim se a receita de aplicações de IA é inerentemente igual à receita de SaaS. Para justificar múltiplos elevados, empresas de IA precisam não só provar que os usuários estão dispostos a pagar, mas também que a margem de lucro, ponderada pelo uso, pode melhorar continuamente.

Uma cadeia de custos de inferência por trás da assinatura

A maior diferença entre assinaturas de IA e SaaS comum é que o custo marginal de uma única utilização não é mais próximo de zero.

Em SaaS tradicional, abrir uma conta adicional para uma equipe gera custos de servidores, suporte e banda, mas esses custos geralmente não aumentam linearmente a cada clique. Os custos mais caros estão no desenvolvimento, vendas e aquisição de clientes iniciais. Após a escala, uma parte significativa da receita adicional pode ser mantida.

Produtos de grandes modelos diferem. Quando o usuário faz uma pergunta, o modelo gera uma resposta — esse processo é inferência, ou seja, o cálculo real realizado pelo modelo ao ser chamado. Token é a unidade básica de leitura e escrita de texto pelo modelo. Quanto mais perguntas, maior o contexto, mais conteúdo gerado, maior o consumo de tokens e poder de processamento.

Isso cria um conflito entre uma assinatura fixa e custos variáveis. A assinatura de aproximadamente 20 dólares por mês para Claude Pro nos EUA é influenciada por região, impostos e ajustes da Anthropic. O usuário vê um preço fixo, mas a empresa de modelos enfrenta comportamentos de uso muito diferentes. Alguns apenas enviam e-mails ou consultam informações, outros processam documentos longos, executam tarefas de código ou chamam fluxos de automação mais complexos.

Um gráfico de divisão popular tenta concretizar isso: dentro dos 20 dólares, uma parte fica com a empresa de modelos, outra é paga aos fornecedores de computação e nuvem. Os custos de computação incluem eletricidade, manutenção e depreciação de GPU. A compra de GPUs, por sua vez, se conecta a Nvidia, TSMC, fornecedores de HBM (memória de alta largura de banda), módulos ópticos, OEMs e empresas de energia.

A "depreciação de GPU" aqui pode ser entendida como o fato de que GPUs caras não são uma despesa única, mas são amortizadas ao longo do tempo, de acordo com a vida útil, intensidade de uso ou critérios contábeis. A alocação real depende de limites de pacotes, proporção de usuários leves e pesados, preços internos de fornecedores de nuvem, descontos por reserva de capacidade, taxa de utilização de GPU e período de depreciação. O custo médio não é igual ao custo marginal.

O que os investidores realmente precisam monitorar é a direção: empresas de IA não podem apenas divulgar crescimento de receita, mas também responder se os custos de computação acompanham esse crescimento. Se o uso aumenta mais rápido que a eficiência do modelo, uma receita de assinatura maior pode pressionar a margem de lucro. Somente melhorias de eficiência suficientemente rápidas podem permitir que empresas de modelos se aproximem novamente da estrutura de lucros de software.

Infraestrutura recebe receitas mais certas primeiro

Atualmente, o crescimento do uso de IA está mais diretamente ligado à infraestrutura do que ao consolidado na camada de aplicação.

Independentemente de o usuário usar Claude, ChatGPT, Gemini ou agentes internos, o inferência final recai sobre computação, eletricidade, memória e rede. A camada de aplicação pode mudar de produto, mas os recursos subjacentes são mais rígidos. Desde que o uso de IA continue a subir, gastos com nuvem, compra de GPUs, demanda por HBM e consumo de energia de centros de dados também aumentarão.

Essa é uma das razões pelas quais Nvidia, TSMC, SK Hynix e outros fornecedores de infraestrutura continuam a ser reavaliados pelo mercado. Nos últimos anos, a margem bruta geral da Nvidia permaneceu alta, com previsão para FY2026 de aproximadamente 71,1% (GAAP) e 71,3% (não GAAP), mantendo-se em patamares elevados nas próximas previsões trimestrais. É importante notar que alguns trimestres podem ser influenciados por despesas específicas, e os relatórios públicos nem sempre revelam a verdadeira margem de lucro de centros de dados de IA, mas a escassez de infraestrutura com poder de precificação já se reflete nos resultados.

A HBM é um exemplo típico dessa cadeia. Não é uma memória comum, mas um componente-chave para aceleradores de IA que suportam cálculos de alta taxa de transferência. Com o aumento do tamanho do modelo, do comprimento do contexto e da demanda por inferência paralela, a dependência de memória de alta largura de banda aumenta. Estimativas da cadeia de suprimentos indicam que a participação do HBM no custo de novas gerações de chips de IA está crescendo, o que explica a reavaliação de empresas como SK Hynix, Samsung e Micron durante o ciclo de IA.

Eletricidade e centros de dados também passaram de custos de fundo a principais focos de investimento. O consumo de energia por consulta de texto simples pode não ser alto, mas tarefas complexas de agentes, longos contextos, geração de código e múltiplas rodadas aumentam o volume de cálculo. Para provedores de nuvem e operadores de centros de dados, o que importa não é só o consumo de energia de uma consulta, mas a utilização contínua de clusters, tarifas de eletricidade, refrigeração, capacidade de data centers e conexão à rede elétrica, que se tornam gargalos de custo.

Vantagens na infraestrutura se refletem em validações de desempenho mais rápidas. Os investimentos em nuvem para IA já estão em andamento, a receita e margem da Nvidia aparecem nos relatórios, pedidos e preços de HBM também entram rapidamente na linha de lucros. O que ocorre na camada de aplicação de modelos é mais uma expectativa futura: conversão de assinantes, penetração empresarial, receita de API e a eventual redução de custos que libera lucros.

A melhoria de eficiência continua sendo o principal argumento de alta

Investidores de software e de IA não estão sem argumentos contrários. A visão de que a alta atual nos custos de inferência é apenas uma fase inicial se baseia na expectativa de que otimizações de modelos, cache, modelos menores, chips próprios e maior utilização de clusters continuarão a reduzir custos unitários. Se os custos caírem rápido o suficiente, aplicações de IA podem retornar à lógica de software de alta margem.

Essa contra-argumentação tem fundamentos reais. Alguns modelos principais já reduziram significativamente o custo por token sob capacidades iguais ou superiores. A OpenAI revelou que o GPT-4o mini tem uma redução de 99% no custo por token em relação ao text-davinci-003 inicial. Empresas diferentes têm ritmos variados, e a Anthropic recentemente tem mostrado melhorias de preço e camadas de modelos, mas a direção do setor ainda é oferecer maior capacidade a custos menores.

Empresas de modelos também têm várias estratégias para melhorar a economia unitária. Tarefas simples podem ser delegadas a modelos menores, solicitações comuns podem usar cache, tarefas longas ou complexas podem ser feitas por modelos mais avançados. Provedores de nuvem reduzem custos de computação com chips próprios e agendamento de clusters. Google tem TPU, Microsoft lançou Maia para inferência, Amazon também avança com Trainium e Inferentia.

Se apenas considerarmos o avanço tecnológico, há espaço para melhorias na margem de lucro de aplicações de IA. Inferência mais barata, melhor roteamento de modelos, maior compressão, tudo isso permite que uma assinatura de 20 dólares suporte maior volume de uso. Usuários leves, pacotes empresariais de alto valor, preços escalonados por API e limites de uso mais rígidos também podem melhorar a economia geral por unidade.

O desafio é que a redução de custos não é o único fator. As aplicações de IA estão evoluindo de simples chat para cargas de trabalho mais pesadas. Antes, os usuários faziam perguntas ou reescreviam textos; agora, há uma demanda crescente por agentes de código, processamento de documentos longos, geração de vídeos e multimodalidade, automação empresarial. Esses cenários têm maior valor e consumo mais intenso. Quanto mais útil for o modelo, mais provável é que os usuários deleguem tarefas mais complexas e prolongadas a ele.

As divergências tornam-se mais específicas: a velocidade de redução do custo de inferência, se pode superar o crescimento do uso e da complexidade das tarefas. Se o custo unitário cair rapidamente, mas o consumo médio dos usuários aumentar mais rápido, a margem ponderada de lucro das empresas de modelos ainda será pressionada. Por outro lado, se roteamento de modelos, cache, chips próprios e preços escalonados forem eficazes, a assinatura de IA pode gradualmente se livrar das características de alto custo de hoje.

Número de assinantes não equivale a margem de lucro

O gráfico de divisão de 20 dólares não deve ser interpretado como uma conclusão definitiva. Ele funciona mais como um lembrete de avaliação na fase atual: quando o mercado ainda não tem dados transparentes suficientes sobre a margem de lucro de empresas de modelos, investidores devem descontar a hipótese de que "IA aplicada é inerentemente igual a SaaS".

Para empresas como OpenAI e Anthropic, que ainda não são listadas, é difícil para investidores externos verem registros completos. Materiais de financiamento, divulgações de parceiros, estrutura de custos de nuvem, preços de pacotes empresariais, participação de receita de API e limites de uso são pistas importantes. Os dados mais valiosos não são o número de usuários pagos, mas a proporção de usuários leves e pesados, se empresas estão dispostas a pagar mais por uso intenso, se os custos de nuvem estão caindo e se o custo por inferência está diminuindo o suficiente para melhorar a margem de lucro.

Para empresas listadas, a validação virá mais rapidamente dos relatórios financeiros. A margem de lucro geral da Nvidia, o crescimento da receita de centros de dados, a demanda por processos avançados na TSMC, os preços e margens de HBM, e o investimento de capital de provedores de nuvem continuarão a refletir se o uso de IA ainda está se transferindo para a infraestrutura. Se esses indicadores permanecerem fortes, mas a camada de aplicação de modelos não mostrar melhorias na margem, o mercado continuará a atribuir uma avaliação mais alta à infraestrutura.

Por fim, para que as empresas de modelos recuperem uma avaliação mais elevada, precisam demonstrar que, além de os usuários pagarem 20 dólares, esses assinantes de uso intensivo ainda deixam margem suficiente. A próxima rodada de divergências de preços provavelmente não estará nos números de ARR, mas na capacidade de reduzir custos de inferência, limites de pacotes e preços corporativos ao mesmo tempo.

Clique para conhecer as vagas do BlockBeats em recrutamento

Participe do grupo oficial do BlockBeats no Telegram:

Assinatura no Telegram: https://t.me/theblockbeats

Grupo de discussão no Telegram: https://t.me/BlockBeats_App

Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado