Quanto a empresa de módulos ópticos consegue obter da taxa de assinatura que você paga ao Claude?

TL;DR

· Gráfico de divisão de custos de assinatura do Claude 20 dólares, detalhando uma mensalidade de IA dividida entre a empresa de modelos, computação em nuvem, GPU, eletricidade e cadeia de suprimentos.

· Assinaturas de IA têm custos contínuos de inferência, não podendo aplicar diretamente a suposição de alta margem de lucro de SaaS tradicional.

· Ativos relacionados: OpenAI, Anthropic, Microsoft, Amazon, Google, Nvidia (NVDA), TSMC, SK Hynix, Samsung, Micron, centros de dados e cadeia de energia.

Um gráfico que divide aproximadamente 20 dólares de assinatura mensal do Claude Pro nos EUA entre a empresa de modelos, computação em nuvem, depreciação de GPU, eletricidade e cadeia de suprimentos está fazendo investidores reconsiderarem como valorizar a receita de aplicações de IA.

Este gráfico não é uma divisão oficial de receita de Anthropic, nuvem da Amazon ou Nvidia, nem deve ser considerado como os registros financeiros reais de qualquer empresa. Seu valor está em levantar uma questão mais fundamental: quanto da assinatura paga pelo usuário às aplicações de IA pode, de fato, se consolidar como margem de lucro de software, como no SaaS tradicional?

A avaliação do SaaS tradicional é bastante clara. Após o desenvolvimento do software, vender mais uma conta geralmente tem custos adicionais baixos, e empresas maduras de software puro frequentemente têm margens de lucro de 70% ou até 80%. Investidores estão dispostos a pagar múltiplos elevados porque, à medida que a receita cresce, há potencial para aumento contínuo da margem de lucro.

O problema das aplicações de IA é que, toda vez que o usuário faz uma pergunta, escreve código, analisa um arquivo ou chama um agente, há consumo de tempo de GPU, eletricidade, largura de banda de memória e recursos de nuvem. Apesar de parecer uma taxa fixa mensal, na base há uma cadeia de custos que varia com o uso. Usuários leves podem gerar alta margem, enquanto usuários intensivos, que operam dentro de limites de uso ou pacotes de ferramentas, podem ver seus custos subir rapidamente.

Portanto, o gráfico de divisão de 20 dólares não questiona quanto cada empresa retém, mas sim se a receita de aplicações de IA é inerentemente igual à receita de SaaS. Para justificar múltiplos elevados, empresas de IA precisam não apenas mostrar que os usuários estão dispostos a pagar, mas também que a margem de lucro, ponderada pelo uso, pode melhorar de forma sustentável.

Há uma cadeia de custos de inferência por trás da assinatura

A maior diferença entre assinaturas de IA e SaaS comum é que o custo marginal de uma única utilização não é mais próximo de zero.

Em SaaS tradicional, abrir uma conta adicional para uma equipe envolve custos de servidores, suporte e banda, mas esses custos geralmente não aumentam linearmente a cada clique. Os custos mais caros estão no desenvolvimento, vendas e aquisição de clientes iniciais. Com escala, uma parte significativa da receita adicional pode se manter como lucro.

Modelos grandes, por outro lado, funcionam de forma diferente. Quando o usuário faz uma pergunta, o modelo gera uma resposta — esse processo é chamado de inferência, ou seja, o cálculo real realizado pelo modelo ao ser chamado. Token é a unidade básica de leitura e escrita de texto pelo modelo. Quanto mais perguntas, maior o comprimento do contexto e mais complexa a geração de conteúdo, maior o consumo de tokens e poder de processamento.

Isso cria um conflito entre custos fixos de assinatura e custos variáveis. Com uma assinatura de cerca de 20 dólares nos EUA, o preço pode variar por região, impostos e ajustes da Anthropic. O usuário vê um preço fixo, mas a empresa de modelos enfrenta comportamentos de uso muito diferentes. Alguns apenas enviam e-mails ou consultam informações, outros processam documentos longos, executam tarefas de código ou chamam fluxos de automação mais complexos.

Um gráfico de divisão popular tenta concretizar isso: dentro dos 20 dólares, uma parte fica com a empresa de modelos, outra parte vai para fornecedores de computação em nuvem e recursos de processamento. Os custos de computação incluem eletricidade, manutenção e depreciação de GPU. A compra de GPUs, por sua vez, alimenta Nvidia, TSMC, fornecedores de HBM (memória de alta largura de banda), módulos ópticos, OEMs e empresas de energia.

A "depreciação de GPU" aqui pode ser entendida como o fato de que GPUs caras não são uma despesa única, mas são amortizadas ao longo do tempo, de acordo com a vida útil, intensidade de uso ou critérios contábeis. A alocação real depende de limites de pacotes, proporção de usuários leves e pesados, preços internos de fornecedores de nuvem, descontos por reserva de capacidade, taxa de utilização de GPU e período de depreciação. O custo médio não é igual ao custo marginal.

O que os investidores realmente precisam monitorar é a direção: empresas de IA não podem apenas divulgar crescimento de receita, mas também precisam responder se os custos de computação por trás do crescimento estão crescendo na mesma proporção. Se o uso aumenta mais rápido que a eficiência do modelo, a receita de assinatura mais alta pode pressionar a margem de lucro. Somente melhorias de eficiência suficientemente rápidas podem permitir que empresas de modelos se aproximem novamente da estrutura de lucros de software.

Infraestrutura recebe receitas mais certas primeiro

No estágio atual, o crescimento do uso de IA está mais diretamente ligado à infraestrutura do que ao valor consolidado na camada de aplicação.

Independentemente de o usuário usar Claude, ChatGPT, Gemini ou agentes internos, o inferimento sempre depende de computação, eletricidade, memória e rede. A camada de aplicação pode mudar de produto, mas os recursos subjacentes são mais rígidos. Desde que o uso de IA continue crescendo, gastos com nuvem, compra de GPUs, demanda por HBM e consumo de energia de centros de dados também aumentarão.

Essa é uma das razões pelas quais Nvidia, TSMC, SK Hynix e outros fornecedores de infraestrutura continuam sendo reavaliados pelo mercado. Nvidia, por exemplo, mantém margens elevadas, com uma margem bruta GAAP de cerca de 71,1% e não GAAP de 71,3% para FY2026, com previsões de trimestre também altas. É importante notar que alguns trimestres podem ser influenciados por despesas específicas, e os relatórios financeiros nem sempre detalham a margem de lucro real de centros de dados de IA, mas a escassez de infraestrutura com poder de precificação já se reflete nos resultados.

A HBM é um exemplo típico dessa cadeia. Não é uma memória comum, mas um componente-chave para aceleradores de IA que suportam cálculos de alta taxa de transferência. Com o aumento do tamanho do modelo, comprimento do contexto e demanda por inferência paralela, a dependência de memória de alta largura de banda aumenta. Estimativas da cadeia de suprimentos indicam que a participação do HBM no custo de novas gerações de chips de IA está crescendo, o que explica a reavaliação de fornecedores como SK Hynix, Samsung e Micron durante o ciclo de IA.

Eletricidade e centros de dados também passaram a ser prioridades de investimento. Embora uma consulta de texto simples consuma energia relativamente pouco, tarefas complexas de agentes, longos contextos, geração de código e múltiplas rodadas aumentam o volume de cálculo. Para provedores de nuvem e operadores de centros de dados, o que importa não é apenas o consumo de energia de uma consulta, mas a utilização contínua de clusters, tarifas de energia, refrigeração, capacidade de data center e conexão à rede elétrica, que se tornam gargalos de custo.

A vantagem na infraestrutura é que a validação de desempenho é mais rápida. Os gastos de capital em IA por provedores de nuvem já estão ocorrendo, a receita e margem de Nvidia aparecem nos relatórios, pedidos de HBM e preços também entram rapidamente na linha de lucros. As transações na camada de aplicação de modelos envolvem mais expectativas futuras: conversão de assinantes, penetração empresarial, receita de API e a eventual redução de custos que libera lucros.

A melhoria de eficiência continua sendo o principal argumento de alta

Investidores de software e de IA não estão sem argumentos contrários. A visão otimista é que o alto custo de inferência hoje é uma fase inicial, e melhorias em modelos, cache, pequenos modelos, chips próprios e maior utilização de clusters continuarão a reduzir custos unitários. Se os custos caírem rápido o suficiente, aplicações de IA podem retornar à lógica de software de alta margem.

Esse contra-argumento tem base real. Alguns modelos principais já reduziram significativamente o custo por token sob capacidades iguais ou superiores. A OpenAI revelou que o GPT-4o mini tem uma redução de 99% no custo por token em relação ao text-davinci-003 inicial. As empresas têm ritmos diferentes, e a Anthropic recentemente tem mostrado melhorias de preço e camadas de modelos, mas a direção do setor ainda é oferecer maior capacidade a custos menores.

Empresas de modelos também têm várias estratégias para melhorar a economia por unidade. Tarefas simples podem ser delegadas a modelos menores, solicitações comuns podem usar cache, tarefas longas ou complexas podem ser feitas por modelos mais avançados. Provedores de nuvem reduzem custos unitários com chips próprios e agendamento de clusters. Google tem TPU, Microsoft lançou Maia para inferência, Amazon também avança com Trainium e Inferentia.

Se apenas considerarmos o avanço tecnológico, há espaço para melhorias na margem de lucro de aplicações de IA. Inferência mais barata, melhor roteamento de modelos, maior compressão, tudo isso permite que uma assinatura de 20 dólares suporte maior volume de uso. Usuários leves, pacotes empresariais de alto valor, precificação por camadas na API e limites de uso mais rigorosos também podem melhorar a economia geral por unidade.

O desafio é que a redução de custos não é o único fator. As aplicações de IA estão evoluindo de simples chat para cargas de trabalho mais pesadas. Antes, os usuários faziam apenas perguntas e reescreviam textos; agora, há uma demanda crescente por agentes de código, processamento de documentos longos, vídeos e geração multimodal, automação empresarial. Esses cenários têm maior valor e consumo mais intenso. Quanto mais útil for o modelo, mais provável é que os usuários deleguem tarefas mais complexas e prolongadas a ele.

As divergências tornam-se mais específicas: a velocidade de redução do custo de inferência, se pode superar o crescimento do uso e da complexidade das tarefas. Se o custo unitário cair rapidamente, mas o consumo médio dos usuários aumentar mais rápido, a margem ponderada de lucro das empresas de modelos ainda será pressionada. Por outro lado, se roteamento de modelos, cache, chips próprios e precificação por camadas forem eficazes, a assinatura de IA pode gradualmente se livrar do peso de custos elevados de hoje.

Usuários de assinatura não determinam a margem de lucro

O gráfico de divisão de 20 dólares não deve ser interpretado como uma conclusão definitiva. Ele funciona mais como um lembrete de avaliação na fase atual: quando o mercado ainda não tem dados transparentes suficientes sobre a margem de lucro de empresas de modelos, investidores precisam descontar a hipótese de que "IA aplicada é inerentemente SaaS".

Para empresas como OpenAI e Anthropic, que ainda não são listadas, é difícil para investidores externos verem registros completos. Materiais de financiamento, divulgações de parceiros, estrutura de custos de nuvem, preços de pacotes empresariais, participação de receita de API e limites de uso são pistas importantes. Os dados mais valiosos não são o número de usuários pagos, mas a proporção de usuários leves e pesados, se clientes empresariais estão dispostos a pagar mais por uso intenso, se os custos de nuvem estão caindo e se o custo por inferência pode melhorar a margem de lucro.

Para empresas listadas, a validação virá mais rapidamente dos relatórios financeiros. A margem bruta geral da Nvidia, o crescimento da receita de centros de dados, a demanda por processos avançados da TSMC, os preços e margens de fornecedores de HBM, e o investimento de capital de provedores de nuvem continuarão refletindo se o uso de IA ainda está se transferindo para a infraestrutura. Se esses indicadores permanecerem fortes, mas a camada de aplicação de modelos não mostrar melhorias de margem, o mercado continuará atribuindo uma avaliação mais alta à infraestrutura.

Por fim, para que as empresas de modelos recuperem uma avaliação mais alta, precisam demonstrar que, além de os usuários pagarem 20 dólares, esses assinantes de uso intenso ainda geram margens suficientes. A próxima rodada de divergências de preços provavelmente não estará nos números principais de ARR, mas na capacidade de reduzir custos de inferência, limites de pacotes e preços corporativos ao mesmo tempo.

Clique para conhecer as vagas do BlockBeats em ação

Participe do grupo oficial do BlockBeats no Telegram:

Assinatura no Telegram: https://t.me/theblockbeats

Grupo de discussão no Telegram: https://t.me/BlockBeats_App

Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado