Como encontrar um espaço de monetização sustentável na camada de aplicação de IA?

Question

O modelo de assinatura de IA voltado ao consumidor está preso em um dilema: os custos de token continuam subindo, enquanto a disposição dos usuários em pagar não cresce na mesma proporção. Essa tensão estrutural torna esse modelo de negócios extremamente frágil. Uma comercialização mais sustentável da IA pode ocorrer em cenários de alto valor para o usuário, workflows profundamente integrados e vinculados a resultados reais de negócios. Esta é a premissa econômica por trás do surgimento de plataformas verticais de IA. Na 9ª edição da "Agentic Economy", vamos dissecar três casos — Harvey, Farther e Adyen — para ver como eles constroem vantagens competitivas em um cenário de commoditização de modelos fundamentais. Também enfrentaremos duas perguntas mais difíceis: essas vantagens ainda se sustentam quando os subsídios de token desaparecem? E o que significa quando OpenAI e Anthropic começam a enviar equipes de engenharia para clientes corporativos?

Qualquer tecnologia, uma vez que se torna suficientemente onipresente, deixa de gerar prêmios. O mesmo vale para grandes modelos de uso geral. À medida que os retornos marginais da competição paramétrica diminuem, a inteligência antes escassa está rapidamente evoluindo para uma infraestrutura pública commoditizada. Isso está acelerando o colapso do modelo de negócios de aplicações leves que dependem exclusivamente de APIs de terceiros e carecem de capacidade de integração contextual.

Mas a commoditização nunca é o fim. Cada vez que uma nova tecnologia se torna popular, ela desloca o valor daqueles que a possuem para aqueles que realmente conseguem aplicá-la de forma prática.

Essa dinâmica está impulsionando a rápida ascensão das plataformas verticais de IA.

As chamadas plataformas verticais de IA são aplicações de IA que mergulham em setores específicos, encapsulam profundamente as capacidades de grandes modelos de uso geral e reorganizam os workflows de negócios em torno de tarefas especializadas. Ao construir seus próprios sistemas de avaliação (Eval) e arquiteturas multi-agente, essas plataformas estão rebaixando os modelos fundamentais subjacentes a componentes computacionais substituíveis a qualquer momento, travando os ativos de workflow mais essenciais do setor dentro do sistema. O núcleo está em eliminar o atrito nos processos de negócios, transformando trabalhos profissionais complexos em ativos sistêmicos acumuláveis.

Para entender a validade dessa nova pista, é preciso primeiro esclarecer um fato: o que empresas e profissionais pagam nunca é a escala de parâmetros do modelo subjacente, mas sim sua capacidade de se integrar profundamente aos workflows internos, formar um ciclo fechado de dados e impulsionar receitas reais.

Por isso, especialistas jurídicos com altas taxas horárias, consultores financeiros que atendem clientes de alto patrimônio líquido e grandes comerciantes que lidam com enormes volumes de transações estão se tornando o foco da nova geração de plataformas verticais de IA. Essas pessoas detêm poder de decisão orçamentária, assumem responsabilidades de conformidade e são orientadas por resultados de negócios claros. Seja ajudando um advogado que cobra mil dólares por hora a economizar dez horas, ou auxiliando um consultor de patrimônio a aumentar o volume de ativos gerenciados e otimizar retornos após impostos, o valor comercial gerado pode ser diretamente quantificado. Esse vínculo preciso com produtores de alto valor é a base econômica que permite que a IA vertical funcione.

Atualmente, essa exploração está ocorrendo principalmente em duas direções.

A primeira é usar a IA para reorganizar workflows profissionais, comprimindo drasticamente os custos operacionais que antes só estavam disponíveis para grandes instituições. Nos segmentos jurídico e de gestão de patrimônio, tarefas de alto nível como conformidade, gestão de risco e entrega profissional estão sendo sistematicamente assumidas por plataformas tecnológicas, permitindo que profissionais realizem trabalhos de maior densidade com menos recursos.

A segunda é a reconstrução da infraestrutura de transações, remodelando a conexão entre comerciantes e agentes. No comércio agentivo, embora a interceptação e interação de intenções na ponta frontal seja controlada por laboratórios de IA, a conversão final de transações ainda ocorre na infraestrutura do lado do comerciante. A Adyen Agentic atua como um tradutor universal, ajudando os comerciantes a se conectar uma vez e participar de várias plataformas de compras baseadas em IA entre protocolos, sem precisar reconstruir sistemas para cada novo protocolo.

Os três casos têm pontos de entrada diferentes, mas todos transformam capacidades centrais do setor que antes eram difíceis de padronizar em ativos que podem ser chamados de forma sustentável através do sistema. A Harvey cristaliza julgamento jurídico e conhecimento do setor; a Farther cristaliza relacionamentos com clientes de consultores e capacidade de otimização fiscal; a Adyen cristaliza dados de produtos dos comerciantes, adaptação de protocolo e capacidade de liquidação.

Isso é o que o CEO da Microsoft, Satya Nadella, chama de Capital de Token: o valor de longo prazo da IA não vem apenas da execução única de tarefas, mas de estruturar e armazenar julgamento humano, conhecimento e workflows no sistema, formando ativos que podem se auto-iterar por meio de interação contínua.

US$ 190 milhões de ARR e US$ 460 milhões em custos de computação: A escala insustentável da Harvey

A Harvey é uma das amostras de maior valuation e crescimento mais rápido na atual onda de IA vertical. O potencial e os dilemas dessa lógica são mais concentrados na Harvey.

Essa plataforma jurídica, que não possui nenhum modelo de uso geral, com base na personalização profunda dos workflows centrais dos escritórios de advocacia, aumentou seu ARR de US$ 100 milhões para US$ 190 milhões em cinco meses (agosto de 2025 a janeiro de 2026), atingindo um valuation de US$ 11 bilhões. Isso mostra que as plataformas verticais não precisam participar da briga fundamental pelos grandes modelos de uso geral; basta entender as tarefas do setor e reconstruir o cenário de trabalho diário de usuários de alto valor para construir uma forte capacidade de comercialização.

Mas por trás dos números financeiros impressionantes, há uma conta de computação em constante expansão.

Dados públicos mostram que o uso mensal de tokens da Harvey cresceu de cerca de 1 trilhão inicialmente para 12-13 trilhões. A um custo estimado de US$ 3 por milhão de tokens, suas despesas anuais teóricas de inferência chegam a US$ 468 milhões. Embora atualmente esse custo seja temporariamente reduzido por meio de descontos de grandes fornecedores e técnicas como Prompt Caching, a estrutura de custos dependente significa que, uma vez que os subsídios diminuam, a conta vai disparar imediatamente. Sob essa pressão financeira, o crescimento do ARR dificilmente se traduz em fluxo de caixa real, correndo o risco de ser contraproducente em escala.

Por trás disso está o paradoxo de custo inevitável para aplicações nativas de IA: quanto mais popular o produto, maior o custo de inferência. O custo marginal do SaaS tradicional é quase zero, mas em cenários jurídicos de contexto longo e alta densidade de inferência, cada tarefa complexa consome poder computacional real. Desenvolver modelos próprios, portanto, deixa de ser uma opção técnica e se torna uma necessidade impulsionada pelos custos.

Atualmente, a Harvey está avançando em uma estratégia de pós-treinamento de modelos proprietários, em cooperação profunda com a Applied Compute, realizando um ajuste fino especializado para o setor jurídico em modelos de base de código aberto (como GLM-5.1). De acordo com a divulgação técnica mais recente de ambas as partes, o modelo proprietário pós-treinado aumentou a taxa de aprovação de rubrica (rubric pass rate) de 0,853 para 0,913 no benchmark de agente jurídico (LAB) desenvolvido pela própria Harvey, superando o GPT-5.5 xhigh e se aproximando do Opus 4.8 Max.

A compressão de custos também é significativa. Ao substituir o modelo de avaliação de modelos de fronteira para GPT-5 Mini e processar vários critérios de avaliação em lote, os custos de avaliação foram reduzidos em 40 a 100 vezes. Isso significa que a Harvey pode iterar continuamente seu ciclo de avaliação a um custo menor, e o próprio sistema de avaliação privado se torna um ativo competitivo acumulável.

Mais digno de nota são as mudanças que ocorreram por trás do aumento de desempenho. A integridade da saída, a precisão numérica, a rastreabilidade de documentos e a supressão de alucinações tiveram melhorias quantificáveis. Durante o treinamento, o número de vezes que o modelo chama ferramentas continua diminuindo, mas cada chamada é mais precisa, e o consumo total de tokens também cai. Em outras palavras, o modelo aprendeu como trabalhar efetivamente em um ambiente de ferramentas específico, e esse padrão de comportamento acumulado por meio de inúmeras tarefas jurídicas é mais difícil de ser replicado externamente do que os próprios parâmetros do modelo.

O caso da Harvey ilustra que as bases competitivas das plataformas verticais de IA estão se aprofundando. O design do workflow e o relacionamento com o cliente são importantes, mas a capacidade de pós-treinamento e controle do modelo de código aberto, o sistema de avaliação privado e a capacidade de geração de dados, a arquitetura multi-agente e a otimização do custo de inferência estão se tornando novas fontes de diferenciação.

A desorganização da Farther: Quebrando o vínculo dos corretores tradicionais com consultores

Se a Harvey comprime os custos de entrega dentro de grandes organizações de serviços profissionais, a plataforma de gestão de patrimônio Farther mostra como ajudar talentos principais a escapar da atração gravitacional dos gigantes tradicionais.

A Farther é uma plataforma tecnológica voltada para consultores independentes (RIA), que recruta especificamente consultores de patrimônio que saíram de gigantes como Morgan Stanley, Merrill Lynch, UBS e Goldman Sachs. No regime tradicional de corretagem de serviço completo, os consultores muitas vezes sofrem com baixa participação nos lucros e pesadas cargas administrativas de back-office. A abordagem da Farther é recrutar consultores diretamente e integrar as capacidades de back-office antes monopolizadas por grandes instituições em uma plataforma unificada: além de alta participação nos lucros, inclui funcionalidades como colheita de perdas fiscais, indexação direta, acesso a mercados privados, revisão de conformidade e gerenciamento de documentos. Segundo dados oficiais, apenas o algoritmo inteligente de impostos pode gerar uma melhoria de 1% a 3% no retorno de investimento após impostos para os clientes.

Esse modelo já recebeu forte validação do mercado de capitais. Em maio de 2026, a Farther concluiu uma rodada Série D de US$ 150 milhões liderada pela General Atlantic, entrando formalmente no clube dos unicórnios. Atualmente, os ativos sob gestão que ela atrai e gerencia ultrapassam US$ 23 bilhões, incluindo uma equipe de banqueiros privados estrela recém-caçada do departamento de patrimônio privado do Goldman Sachs, com US$ 1,5 bilhão em ativos gerenciados. O fluxo contínuo de consultores de patrimônio independentes mostra que o vínculo sistêmico que sustentava os grandes corretores tradicionais está se rompendo, e a prática independente fora das instituições não é mais uma opção marginal para poucos.

A Harvey foca em melhorar a eficiência de entrega profissional dentro dos escritórios de advocacia; a Farther, por sua vez, construiu do zero uma plataforma independente que permite que consultores obtenham capacidades de back-office iguais ou até melhores sem depender de grandes corretores tradicionais. Os pontos de entrada são diferentes, mas ambas estão redefinindo a forma de produção de serviços profissionais. Com o suporte dessa plataforma, ferramentas de investimento complexas, como indexação direta e mercados privados, que antes estavam restritas a departamentos de ultra-alto patrimônio líquido (UHNW) de grandes instituições, agora podem ser facilmente acessadas por consultores independentes, ampliando significativamente o escopo de negócios do profissional individual.

O SaaS tradicional só pode lidar com automação superficial de processos, como registro e armazenamento, incapaz de compartilhar decisões e coordenação complexas. Já os sistemas nativos de IA baseados em arquitetura multi-agente são naturalmente adequados para lidar com áreas cinzentas entre execução administrativa e julgamento lógico não padronizado, como revisão de conformidade, redação de documentos personalizados e recomendações de alocação de ativos. Essas tarefas, que antes exigiam toda uma equipe de back-office para colaborar, estão sendo rapidamente digeridas pelo sistema.

O lado do comerciante subestimado: O ciclo fechado de transações do Agentic Commerce

O comércio agentivo é um tópico quente, mas a atenção atual da opinião pública está quase monopolizada pelo lado do consumidor, ou seja, como os assistentes de IA substituem os usuários na pesquisa de produtos, comparação de preços e realização de pedidos automáticos. Em contraste, o feedback real do lado do comerciante é muito mais frio.

A taxa de conversão do Instant Checkout nativo de IA do Walmart atualmente é apenas um terço do modelo tradicional de clique e redirecionamento; e a proporção de comerciantes que realmente integraram completamente o sistema de checkout AI do Shopify em 2026 ainda é limitada. Existe uma lacuna óbvia entre a ativação da demanda pela IA e a conclusão real da transação.

A razão para essa lacuna é que a transação agentiva é um projeto de engenharia sistêmico. Entender a intenção do usuário é apenas o primeiro passo; para transformar a demanda em receita, é necessário suporte de ponta a ponta, incluindo verificação de estoque, cálculo de impostos, prevenção de fraudes, cumprimento e liquidação de fundos, capacidades que atualmente estão firmemente trancadas nos sistemas locais dos comerciantes. Ao mesmo tempo, vários protocolos de pagamento agentivo, como UCP, ACP, AP2, Agent Pay e Visa Tokenization, coexistem e são incompatíveis entre si, e os comerciantes não têm incentivo para se adaptar a cada um deles, nem podem arcar com o custo da fragmentação técnica.

A Adyen lançou o Adyen Agentic para isso, usando APIs modulares de três camadas para cobrir diferentes partes da cadeia de transações:

Agentic Feed: responsável por distribuir de forma padronizada o catálogo de produtos, preços e dados de estoque em tempo real dos comerciantes para as principais plataformas de AI;
Agentic Cart: conecta os sistemas existentes de checkout, impostos, cumprimento e gerenciamento de pedidos dos comerciantes à base do comércio conversacional;
Agentic Payments: lida com verificação de identidade, gestão de risco de rede e liquidação de fundos multicanal em transações lideradas por agentes.

Uma vez que os comerciantes se integram, a Adyen pode traduzir entre diferentes plataformas e protocolos de agentes de IA, sem precisar reformular os sistemas subjacentes cada vez que o cenário do mercado muda.

No ecossistema de comércio agentivo, os laboratórios de IA e interfaces de conversação frontais podem interceptar a intenção do usuário e o tráfego, mas a conversão de valor substancial, a concretização da transação e o fechamento do ciclo de fundos ainda dependem fortemente da infraestrutura do lado do comerciante. Em comparação com os pontos de entrada frontais altamente competitivos, o serviço de integração sistêmica do lado do comerciante tem mais chance de se consolidar como uma infraestrutura subjacente estável e cobrável.

Preocupações das plataformas verticais: A penetração dos fabricantes de modelos e a reestruturação dos custos de token

Com a saturação de ferramentas universais de baixo custo, a lógica de negócios das plataformas de grandes modelos que se sustenta por assinaturas de baixo preço está gradualmente mostrando sua fragilidade. Quando funções genéricas como resumir páginas da web e rascunhar e-mails são facilmente substituíveis, as plataformas verticais precisam se concentrar em clientes de alto valor que se importam mais com resultados de negócios. Mas quanto mais se avança em setores de alto valor, mais complexo se torna o ambiente competitivo na camada de aplicação.

Uma das pressões vem da extensão proativa dos limites de negócios dos fabricantes de modelos. OpenAI e Anthropic não estão mais satisfeitos em ser apenas atacadistas de API; eles estão se inserindo diretamente nos sites dos principais clientes por meio de equipes de engenharia de campo (FDE). Em abril de 2026, a OpenAI fez parceria com o Customers Bank, que tem US$ 26 bilhões em ativos, com uma equipe de engenharia estacionada no banco para desenvolver agentes de aprovação de empréstimos e abertura de contas usando dados locais; a Anthropic, por sua vez, fez parceria com a gigante de TI financeira FIS, inserindo uma equipe de FDE em seus sistemas internos para desenvolver ferramentas de combate à lavagem de dinheiro, usando os canais do FIS que atendem a muitos bancos para alcançar as profundezas do setor bancário.

Esse modelo de colaboração no local mostra que os grandes fabricantes de modelos estão usando canais de infraestrutura para aprender e replicar diretamente os processos internos de negócios de setores de alta barreira.

Outra pressão é a lógica de precificação de token insustentável. Atualmente, a maioria dos tokens de modelos de fronteira avançados é vendida a preços subsidiados, com prejuízo. Com o alto uso de arquiteturas multi-agente corporativas, uma vez que os subsídios dos grandes fabricantes diminuírem, as contas de computação das plataformas verticais que dependem completamente de APIs de fronteira externas não serão sustentáveis.

Essa pressão aumentará ainda mais com o aumento da demanda por inferência. Quando centenas de agentes 24 horas por dia interagem em alta frequência nos bastidores, a demanda por poder computacional crescerá exponencialmente, e a cadeia de suprimentos de hardware subjacente, limitada por restrições físicas de fabricação extremamente longas, como as máquinas de litografia da ASML, não conseguirá acompanhar rapidamente. Para a maioria dos negócios diários, usar modelos de fronteira para todas as tarefas é em si um grave desajuste de recursos.

É exatamente por isso que a Harvey teve que cooperar com a Applied Compute para estabelecer conjuntos de teste dedicados, sistemas de avaliação privados e pipelines de anotação manual: as plataformas verticais não estão apenas fazendo produtos, mas também realizando engenharia de custos de alto nível: medindo precisamente o consumo de token de cada tarefa, identificando quais etapas intermediárias podem ser desviadas para modelos menores de código aberto de baixo custo, quais decisões críticas requerem modelos caros de ponta, e onde a revisão humana deve ser inserida.

Nesse contexto, uma mera camada de interface elegante de workflow não oferece mais vantagem competitiva duradoura. Levar a engenharia de custos no back-end ao extremo é a chave para a sobrevivência de longo prazo das plataformas verticais de IA.

Conclusão: A escassez do mercado retorna ao topo da cadeia industrial

Quando grandes modelos de uso geral se tornam tão disponíveis quanto água, eletricidade e gás, o valor da camada de aplicação de IA começa a se concentrar nas extremidades superior e inferior da cadeia industrial.

Nesta fase, a escassez do setor não desapareceu: na extremidade superior, ainda está o núcleo que não pode ser padronizado por algoritmos, como confiança do cliente, julgamentos complexos não padronizados e conhecimento não estruturado escondido na experiência do profissional; na extremidade inferior, está a rede de comerciantes, que carrega dados de produtos, cadeias de conformidade e canais de pagamento. O significado real das plataformas verticais é transformar a experiência profissional desses produtores de alto valor em capital de token acumulável.

Isso também determina que a lógica competitiva da camada de aplicação está retornando ao pragmatismo. A "narrativa de escala" que impulsionou a indústria de software na última década está começando a falhar diante das restrições rígidas de custos de computação e cadeia de suprimentos física.

No novo ciclo, a sobrevivência das empresas da camada de aplicação depende de uma arbitragem refinada de custo e computação. Com o fim da guerra de preços dos modelos e as limitações de recursos computacionais, as plataformas de aplicação precisam encontrar o ponto ideal entre custo e desempenho, em vez de continuar dependendo de injeção de capital.

Embora os grandes fabricantes de modelos tenham maiores recursos computacionais e equipes de engenharia de campo, para as plataformas verticais ágeis e profissionais independentes, a vantagem competitiva mais única ainda é transformar sua própria experiência tácita profissional acumulada em ativos sistêmicos que os fabricantes de modelos fundamentais não podem replicar. Evitar a competição ampla por tráfego e priorizar o ciclo fechado de negócios para produtores de alto valor é a lógica que permitirá que a IA vertical sobreviva a longo prazo na era da commoditização dos grandes modelos.

Ver original

Como encontrar um espaço de monetização sustentável na camada de aplicação de IA?

US$ 190 milhões de ARR e US$ 460 milhões em custos de computação: A escala insustentável da Harvey

A desorganização da Farther: Quebrando o vínculo dos corretores tradicionais com consultores

O lado do comerciante subestimado: O ciclo fechado de transações do Agentic Commerce

Preocupações das plataformas verticais: A penetração dos fabricantes de modelos e a reestruturação dos custos de token

Conclusão: A escassez do mercado retorna ao topo da cadeia industrial

Tendências

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fixado