Futuros
Acesse centenas de contratos perpétuos
CFD
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
CFD
Derivativos de CFD de ações dos EUA
Ações dos EUA
Acesse ações e ETFs reais dos EUA
Ações de Hong Kong
Negocie ações de qualidade listadas em Hong Kong
Futuros de ações
Alta alavancagem, negociação 24/7
Ações tokenizadas
Respaldado por ativos de ações reais
IPO Access
Desbloqueie o acesso completo a IPO de ações globais
GUSD
Cunhe GUSD para rendimentos de RWA do Tesouro
Atividades de ações
Negocie ações populares e desbloqueie airdrops generosos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
IPO Access
Desbloqueie o acesso completo a IPO de ações globais
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Centro de riqueza VIP
Planos premium de crescimento de patrimônio
Gestão privada de patrimônio
Alocação premium de ativos
Fundo Quantitativo
Estratégias quant de alto nível
Apostar
Faça staking de criptomoedas para ganhar em produtos PoS
Alavancagem Inteligente
Alavancagem sem liquidação
USD1 Ganhe juros holding
Sem bloqueio, negocie e saque
Promoções
Centro de atividade
Participe de atividades e ganhe recompensas
Indicação
20 USDT
Convide amigos para recompensas de ind.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Anúncio
Atualizações na plataforma em tempo real
Blog da Gate
Artigos do setor de criptomoedas
Serviços VIP
Grandes Descontos nas Taxas
Gerenciamento de ativos
Solução completa de gerenciamento de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicativos da Gate
Transferência Bancária OTC
Deposite e retire moedas fiat
Programa de corretoras
Mecanismos de grandes descontos via API
AI
Gate AI
Seu parceiro de IA conversacional para todas as horas
Gate AI Bot
Use o Gate AI diretamente no seu aplicativo social
GateClaw
Gate Blue Lobster, pronto para usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
10K+ habilidades
Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA
Quanto a empresa de módulos ópticos consegue obter da taxa de assinatura que você paga ao Claude?
TL;DR
Um gráfico que divide aproximadamente 20 dólares de assinatura mensal do Claude Pro nos EUA entre a empresa de modelos, computação em nuvem, depreciação de GPU, eletricidade e cadeia de suprimentos está fazendo investidores reconsiderarem como valorizar a receita de aplicações de IA.
Este gráfico não é uma divisão oficial de receita de Anthropic, nuvem da Amazon ou Nvidia, nem deve ser considerado como os registros financeiros reais de qualquer empresa. Seu valor está em levantar uma questão mais fundamental: quanto da assinatura paga pelo usuário às aplicações de IA pode, de fato, se consolidar como margem de lucro de software, como no SaaS tradicional?
A avaliação do SaaS tradicional é bastante clara. Após o desenvolvimento do software, vender mais uma conta geralmente tem custos adicionais baixos, e empresas maduras de software puro frequentemente têm margens de lucro de 70% ou até 80%. Investidores estão dispostos a pagar múltiplos elevados porque, à medida que a receita cresce, há potencial para aumento contínuo da margem de lucro.
O problema das aplicações de IA é que, toda vez que o usuário faz uma pergunta, escreve código, analisa um arquivo ou chama um agente, há consumo de tempo de GPU, eletricidade, largura de banda de memória e recursos de nuvem. Apesar de parecer uma taxa fixa mensal, na base há uma cadeia de custos que varia com o uso. Usuários leves podem gerar alta margem, enquanto usuários intensivos, que operam dentro de limites de uso ou pacotes de ferramentas, podem ver seus custos subir rapidamente.
Portanto, o gráfico de divisão de 20 dólares não questiona quanto cada empresa retém, mas sim se a receita de aplicações de IA é inerentemente igual à receita de SaaS. Para justificar múltiplos elevados, empresas de IA precisam não apenas mostrar que os usuários estão dispostos a pagar, mas também que a margem de lucro, ponderada pelo uso, pode melhorar de forma sustentável.
Há uma cadeia de custos de inferência por trás da assinatura
A maior diferença entre assinaturas de IA e SaaS comum é que o custo marginal de uma única utilização não é mais próximo de zero.
Em SaaS tradicional, abrir uma conta adicional para uma equipe envolve custos de servidores, suporte e banda, mas esses custos geralmente não aumentam linearmente a cada clique. Os custos mais caros estão no desenvolvimento, vendas e aquisição de clientes iniciais. Com escala, uma parte significativa da receita adicional pode se manter como lucro.
Modelos grandes, por outro lado, funcionam de forma diferente. Quando o usuário faz uma pergunta, o modelo gera uma resposta — esse processo é chamado de inferência, ou seja, o cálculo real realizado pelo modelo ao ser chamado. Token é a unidade básica de leitura e escrita de texto pelo modelo. Quanto mais perguntas, maior o comprimento do contexto e mais complexa a geração de conteúdo, maior o consumo de tokens e poder de processamento.
Isso cria um conflito entre custos fixos de assinatura e custos variáveis. Com uma assinatura de cerca de 20 dólares nos EUA, o preço pode variar por região, impostos e ajustes da Anthropic. O usuário vê um preço fixo, mas a empresa de modelos enfrenta comportamentos de uso muito diferentes. Alguns apenas enviam e-mails ou consultam informações, outros processam documentos longos, executam tarefas de código ou chamam fluxos de automação mais complexos.
Um gráfico de divisão popular tenta concretizar isso: dentro dos 20 dólares, uma parte fica com a empresa de modelos, outra parte vai para fornecedores de computação em nuvem e recursos de processamento. Os custos de computação incluem eletricidade, manutenção e depreciação de GPU. A compra de GPUs, por sua vez, alimenta Nvidia, TSMC, fornecedores de HBM (memória de alta largura de banda), módulos ópticos, OEMs e empresas de energia.
A "depreciação de GPU" aqui pode ser entendida como o fato de que GPUs caras não são uma despesa única, mas são amortizadas ao longo do tempo, de acordo com a vida útil, intensidade de uso ou critérios contábeis. A alocação real depende de limites de pacotes, proporção de usuários leves e pesados, preços internos de fornecedores de nuvem, descontos por reserva de capacidade, taxa de utilização de GPU e período de depreciação. O custo médio não é igual ao custo marginal.
O que os investidores realmente precisam monitorar é a direção: empresas de IA não podem apenas divulgar crescimento de receita, mas também precisam responder se os custos de computação por trás do crescimento estão crescendo na mesma proporção. Se o uso aumenta mais rápido que a eficiência do modelo, a receita de assinatura mais alta pode pressionar a margem de lucro. Somente melhorias de eficiência suficientemente rápidas podem permitir que empresas de modelos se aproximem novamente da estrutura de lucros de software.
Infraestrutura recebe receitas mais certas primeiro
No estágio atual, o crescimento do uso de IA está mais diretamente ligado à infraestrutura do que ao valor consolidado na camada de aplicação.
Independentemente de o usuário usar Claude, ChatGPT, Gemini ou agentes internos, o inferimento sempre depende de computação, eletricidade, memória e rede. A camada de aplicação pode mudar de produto, mas os recursos subjacentes são mais rígidos. Desde que o uso de IA continue crescendo, gastos com nuvem, compra de GPUs, demanda por HBM e consumo de energia de centros de dados também aumentarão.
Essa é uma das razões pelas quais Nvidia, TSMC, SK Hynix e outros fornecedores de infraestrutura continuam sendo reavaliados pelo mercado. Nvidia, por exemplo, mantém margens elevadas, com uma margem bruta GAAP de cerca de 71,1% e não GAAP de 71,3% para FY2026, com previsões de trimestre também altas. É importante notar que alguns trimestres podem ser influenciados por despesas específicas, e os relatórios financeiros nem sempre detalham a margem de lucro real de centros de dados de IA, mas a escassez de infraestrutura com poder de precificação já se reflete nos resultados.
A HBM é um exemplo típico dessa cadeia. Não é uma memória comum, mas um componente-chave para aceleradores de IA que suportam cálculos de alta taxa de transferência. Com o aumento do tamanho do modelo, comprimento do contexto e demanda por inferência paralela, a dependência de memória de alta largura de banda aumenta. Estimativas da cadeia de suprimentos indicam que a participação do HBM no custo de novas gerações de chips de IA está crescendo, o que explica a reavaliação de fornecedores como SK Hynix, Samsung e Micron durante o ciclo de IA.
Eletricidade e centros de dados também passaram a ser prioridades de investimento. Embora uma consulta de texto simples consuma energia relativamente pouco, tarefas complexas de agentes, longos contextos, geração de código e múltiplas rodadas aumentam o volume de cálculo. Para provedores de nuvem e operadores de centros de dados, o que importa não é apenas o consumo de energia de uma consulta, mas a utilização contínua de clusters, tarifas de energia, refrigeração, capacidade de data center e conexão à rede elétrica, que se tornam gargalos de custo.
A vantagem na infraestrutura é que a validação de desempenho é mais rápida. Os gastos de capital em IA por provedores de nuvem já estão ocorrendo, a receita e margem de Nvidia aparecem nos relatórios, pedidos de HBM e preços também entram rapidamente na linha de lucros. As transações na camada de aplicação de modelos envolvem mais expectativas futuras: conversão de assinantes, penetração empresarial, receita de API e a eventual redução de custos que libera lucros.
A melhoria de eficiência continua sendo o principal argumento de alta
Investidores de software e de IA não estão sem argumentos contrários. A visão otimista é que o alto custo de inferência hoje é uma fase inicial, e melhorias em modelos, cache, pequenos modelos, chips próprios e maior utilização de clusters continuarão a reduzir custos unitários. Se os custos caírem rápido o suficiente, aplicações de IA podem retornar à lógica de software de alta margem.
Esse contra-argumento tem base real. Alguns modelos principais já reduziram significativamente o custo por token sob capacidades iguais ou superiores. A OpenAI revelou que o GPT-4o mini tem uma redução de 99% no custo por token em relação ao text-davinci-003 inicial. As empresas têm ritmos diferentes, e a Anthropic recentemente tem mostrado melhorias de preço e camadas de modelos, mas a direção do setor ainda é oferecer maior capacidade a custos menores.
Empresas de modelos também têm várias estratégias para melhorar a economia por unidade. Tarefas simples podem ser delegadas a modelos menores, solicitações comuns podem usar cache, tarefas longas ou complexas podem ser feitas por modelos mais avançados. Provedores de nuvem reduzem custos unitários com chips próprios e agendamento de clusters. Google tem TPU, Microsoft lançou Maia para inferência, Amazon também avança com Trainium e Inferentia.
Se apenas considerarmos o avanço tecnológico, há espaço para melhorias na margem de lucro de aplicações de IA. Inferência mais barata, melhor roteamento de modelos, maior compressão, tudo isso permite que uma assinatura de 20 dólares suporte maior volume de uso. Usuários leves, pacotes empresariais de alto valor, precificação por camadas na API e limites de uso mais rigorosos também podem melhorar a economia geral por unidade.
O desafio é que a redução de custos não é o único fator. As aplicações de IA estão evoluindo de simples chat para cargas de trabalho mais pesadas. Antes, os usuários faziam apenas perguntas e reescreviam textos; agora, há uma demanda crescente por agentes de código, processamento de documentos longos, vídeos e geração multimodal, automação empresarial. Esses cenários têm maior valor e consumo mais intenso. Quanto mais útil for o modelo, mais provável é que os usuários deleguem tarefas mais complexas e prolongadas a ele.
As divergências tornam-se mais específicas: a velocidade de redução do custo de inferência, se pode superar o crescimento do uso e da complexidade das tarefas. Se o custo unitário cair rapidamente, mas o consumo médio dos usuários aumentar mais rápido, a margem ponderada de lucro das empresas de modelos ainda será pressionada. Por outro lado, se roteamento de modelos, cache, chips próprios e precificação por camadas forem eficazes, a assinatura de IA pode gradualmente se livrar do peso de custos elevados de hoje.
Usuários de assinatura não determinam a margem de lucro
O gráfico de divisão de 20 dólares não deve ser interpretado como uma conclusão definitiva. Ele funciona mais como um lembrete de avaliação na fase atual: quando o mercado ainda não tem dados transparentes suficientes sobre a margem de lucro de empresas de modelos, investidores precisam descontar a hipótese de que "IA aplicada é inerentemente SaaS".
Para empresas como OpenAI e Anthropic, que ainda não são listadas, é difícil para investidores externos verem registros completos. Materiais de financiamento, divulgações de parceiros, estrutura de custos de nuvem, preços de pacotes empresariais, participação de receita de API e limites de uso são pistas importantes. Os dados mais valiosos não são o número de usuários pagos, mas a proporção de usuários leves e pesados, se clientes empresariais estão dispostos a pagar mais por uso intenso, se os custos de nuvem estão caindo e se o custo por inferência pode melhorar a margem de lucro.
Para empresas listadas, a validação virá mais rapidamente dos relatórios financeiros. A margem bruta geral da Nvidia, o crescimento da receita de centros de dados, a demanda por processos avançados da TSMC, os preços e margens de fornecedores de HBM, e o investimento de capital de provedores de nuvem continuarão refletindo se o uso de IA ainda está se transferindo para a infraestrutura. Se esses indicadores permanecerem fortes, mas a camada de aplicação de modelos não mostrar melhorias de margem, o mercado continuará atribuindo uma avaliação mais alta à infraestrutura.
Por fim, para que as empresas de modelos recuperem uma avaliação mais alta, precisam demonstrar que, além de os usuários pagarem 20 dólares, esses assinantes de uso intenso ainda geram margens suficientes. A próxima rodada de divergências de preços provavelmente não estará nos números principais de ARR, mas na capacidade de reduzir custos de inferência, limites de pacotes e preços corporativos ao mesmo tempo.
Clique para conhecer as vagas do BlockBeats em ação
Participe do grupo oficial do BlockBeats no Telegram:
Assinatura no Telegram: https://t.me/theblockbeats
Grupo de discussão no Telegram: https://t.me/BlockBeats_App
Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia