Como é que a camada de aplicações de IA pode encontrar espaço para rentabilização sustentável?

O modelo de assinatura de IA de consumo está a enfrentar um dilema: o custo dos tokens continua a subir, mas a vontade dos utilizadores em pagar não acompanha esse crescimento. Esta tensão estrutural torna este modelo de negócio extremamente frágil. Uma comercialização de IA mais sustentável pode ocorrer em cenários de utilizadores de alto valor, workflows profundamente integrados e ligação a resultados reais de negócio. Esta é a premissa económica que justifica a existência do setor da IA vertical. Na 9.ª edição da «Agentic Economy», vamos analisar três casos — Harvey, Farther e Adyen — para perceber como estão a construir vantagem competitiva num contexto de mercadorização dos modelos de base. Enfrentaremos também duas questões mais difíceis: quando os subsídios aos tokens desaparecerem, estas vantagens continuarão a ser válidas? E quando a OpenAI e a Anthropic começarem a colocar equipas de engenharia nos clientes empresariais, o que isso significa?

Qualquer tecnologia, uma vez que se torna suficientemente omnipresente, deixa de gerar prémios. O mesmo acontece com os grandes modelos genéricos. À medida que os retornos marginais da competição paramétrica diminuem, a inteligência que outrora era escassa está a transformar-se rapidamente numa infraestrutura pública mercadorizada. Isto está a acelerar o colapso do modelo de negócio das aplicações leves que dependem apenas de APIs de terceiros e carecem de capacidade de integração contextual.

Mas a mercadorização nunca é o fim. Cada vez que uma nova tecnologia se torna popular, o valor passa das mãos de quem a possui para as mãos de quem a consegue aplicar de forma eficaz.

Esta regra está a impulsionar a rápida ascensão das plataformas de IA vertical na atualidade.

As chamadas plataformas de IA vertical são camadas de aplicação de IA que se aprofundam em setores específicos, encapsulam profundamente as capacidades dos grandes modelos genéricos e reorganizam os fluxos de trabalho empresariais em torno de workflows específicos. Através de sistemas de avaliação (Eval) próprios e arquiteturas multi-agente, estas plataformas estão a reduzir os modelos de base subjacentes a componentes de computação facilmente substituíveis, bloqueando assim os ativos centrais dos fluxos de trabalho do setor dentro do sistema. O seu núcleo reside na eliminação de atritos nos processos empresariais, transformando trabalhos profissionais complexos em ativos sistémicos que podem ser acumulados de forma sustentável.

Para compreender a razão de ser deste novo setor, é necessário esclarecer um facto: as empresas e os profissionais não pagam pela escala de parâmetros do modelo subjacente, mas sim pela sua capacidade de se integrar profundamente nos fluxos de trabalho internos, formar um ciclo de dados fechado e gerar receitas reais.

É por isso que os especialistas jurídicos com honorários elevados, os consultores financeiros que servem clientes de alto património líquido e os grandes comerciantes com enormes volumes de transações estão a tornar-se o foco da nova geração de plataformas de IA vertical. Este grupo detém o poder de decisão orçamental, assume responsabilidades regulatórias e é orientado por resultados de negócio claros. Quer seja ajudar um advogado que cobra milhares de dólares por hora a poupar dez horas, quer seja ajudar um consultor de fortunas a aumentar a escala de gestão e otimizar os retornos após impostos, o valor de negócio criado pode ser quantificado diretamente. Esta ligação precisa a sujeitos de produção de alto valor é a base económica que permite à IA vertical ser viável.

Atualmente, esta exploração segue principalmente duas direções.

A primeira é usar a IA para reorganizar fluxos de trabalho profissionais, comprimindo drasticamente os custos operacionais que antes só as grandes instituições podiam suportar. Nos setores jurídico e de gestão de fortunas, tarefas de alto nível como conformidade, gestão de risco e entrega profissional estão a ser sistematicamente assumidas por plataformas tecnológicas, permitindo que os profissionais realizem trabalho de maior densidade com menos recursos.

A segunda é a reconstrução da infraestrutura de transações, remodelando a ligação entre comerciantes e agentes. No comércio agente (Agentic Commerce), embora a interceção de intenções e a interação no front-end sejam controladas pelos laboratórios de IA, a conversão final das transações ocorre na infraestrutura do lado do comerciante. O Adyen Agentic funciona como um tradutor universal, ajudando os comerciantes a integrar-se uma vez e a participar em várias plataformas de compras de IA através de diferentes protocolos, sem necessidade de reconstruir sistemas para cada novo protocolo.

Os três casos têm abordagens diferentes, mas todos transformam capacidades centrais que, de outra forma, seriam difíceis de padronizar no setor, em ativos sistémicos que podem ser chamados de forma sustentável. A Harvey acumula julgamento jurídico e conhecimento do setor; a Farther acumula relacionamentos com clientes e capacidade de otimização fiscal dos consultores; a Adyen acumula dados de produtos, adaptação de protocolos e capacidade de liquidação dos comerciantes.

É a isto que Satya Nadella, CEO da Microsoft, chama de capital token: o valor de longo prazo da IA não vem apenas da execução de tarefas individuais, mas também de estruturar e armazenar julgamento humano, conhecimento e workflows no sistema, formando ativos que podem iterar-se a si próprios através de interações contínuas.

1,9 mil milhões de ARR e 460 milhões em custos de computação: O jogo de escala insustentável da Harvey

A Harvey é atualmente um dos exemplos de IA vertical com maior valorização e crescimento mais rápido, e o potencial e os dilemas desta lógica estão mais concentrados nela.

Esta plataforma jurídica, que não possui qualquer modelo genérico, conseguiu, através de uma personalização profunda dos fluxos de trabalho principais dos escritórios de advogados, aumentar o ARR de 100 milhões para 190 milhões de dólares em cinco meses (agosto de 2025 a janeiro de 2026), atingindo uma avaliação de 11 mil milhões de dólares. Isto mostra que as plataformas verticais não precisam de competir a nível dos modelos genéricos; basta compreender verdadeiramente as tarefas do setor e reconstruir os cenários de trabalho diário dos utilizadores de alto valor para estabelecer uma forte capacidade de comercialização.

Mas por detrás dos impressionantes números financeiros, há uma fatura de computação em constante expansão.

Dados públicos mostram que o uso mensal de tokens da Harvey cresceu de cerca de 1 bilião inicialmente para 12-13 biliões. Estimando 3 dólares por milhão de tokens, o custo teórico anualizado de inferência ascende a 468 milhões de dólares. Embora este custo seja atualmente reduzido por descontos de grandes fornecedores e tecnologias como Prompt Caching, a estrutura de custos dependente significa que, quando os subsídios diminuírem, a fatura aumentará imediatamente. Sob esta pressão financeira, o crescimento do ARR dificilmente se converte em fluxo de caixa real, correndo antes o risco de ser prejudicado pela escala.

Isto reflete o paradoxo de custos difícil de evitar nas aplicações nativas de IA: quanto mais popular é o produto, mais elevados são os custos de inferência. Os custos marginais do SaaS tradicional são quase zero, mas em cenários como o jurídico, com contextos longos e alta densidade de inferência, cada tarefa complexa consome poder de computação real. Desenvolver modelos próprios deixa, portanto, de ser uma opção técnica para se tornar uma necessidade imposta pelos custos.

Atualmente, a Harvey está a avançar com uma estratégia de pós-treino de modelos proprietários, em parceria com a Applied Compute, para afinar modelos de base de código aberto (como o GLM-5.1) especificamente para o setor jurídico. De acordo com as mais recentes divulgações técnicas, o modelo proprietário pós-treinado aumentou a taxa de aprovação (rubric pass rate) no benchmark de agentes jurídicos da Harvey (LAB) de 0,853 para 0,913, superando o GPT-5.5 xhigh e aproximando-se do Opus 4.8 Max.

A redução de custos é igualmente significativa. Ao substituir o modelo de avaliação de modelos de fronteira para o GPT-5 Mini e ao combinar várias métricas de avaliação em lotes, os custos de avaliação foram comprimidos entre 40 e 100 vezes. Isto significa que a Harvey pode iterar continuamente o ciclo de avaliação a um custo mais baixo, tornando o próprio sistema de avaliação privado num ativo competitivo acumulável.

Mais digno de nota são as mudanças comportamentais observadas após a melhoria do desempenho. A integridade das saídas, a precisão numérica, a rastreabilidade de documentos e a supressão de alucinações tiveram melhorias quantificáveis. Durante o treino, o número de vezes que o modelo chama ferramentas continuou a diminuir, mas cada chamada tornou-se mais precisa, reduzindo também o consumo total de tokens. Por outras palavras, o modelo aprendeu a trabalhar eficazmente num ambiente de ferramentas específico, e este padrão comportamental, acumulado através de inúmeras tarefas jurídicas, é mais difícil de replicar externamente do que os próprios parâmetros do modelo.

O caso da Harvey mostra que a base de competição das plataformas de IA vertical está a aprofundar-se. O design de workflows e as relações com clientes são importantes, mas a capacidade e o controlo do pós-treino de modelos de código aberto, os sistemas de avaliação privados e a capacidade de geração de dados, as arquiteturas multi-agente e a otimização de custos de inferência estão a tornar-se novas fontes de diferenciação.

A desorganização da Farther: Quebrar a ligação tradicional entre os grandes corretores e os consultores

Se a Harvey comprime os custos de entrega dentro das grandes instituições de serviços profissionais, a plataforma de gestão de fortunas Farther mostra como ajudar os talentos principais a escapar à gravidade organizacional dos gigantes tradicionais.

A Farther é uma plataforma tecnológica para consultores independentes (RIA), que recruta especificamente consultores de fortunas que deixaram gigantes como Morgan Stanley, Merrill Lynch, UBS e Goldman Sachs. No sistema tradicional de corretagem de serviço completo, os consultores enfrentam frequentemente comissões baixas e pesadas cargas administrativas de back-office. A Farther recruta diretamente os consultores, integrando as capacidades de back-office antes monopolizadas pelas grandes instituições numa única plataforma unificada: além de comissões elevadas, inclui funções como harvesting de prejuízos fiscais, indexação direta, acesso a mercados privados, auditoria de conformidade e gestão de documentos. Dados oficiais mostram que só o algoritmo inteligente fiscal pode melhorar o retorno do investimento após impostos dos clientes em 1% a 3%.

Este modelo já obteve uma forte validação do mercado de capitais. Em maio de 2026, a Farther completou uma ronda de financiamento Série D de 150 milhões de dólares liderada pela General Atlantic, entrando oficialmente no clube dos unicórnios. Atualmente, os ativos sob gestão que recruta e gere ultrapassaram os 23 mil milhões de dólares, incluindo uma equipa de private banking contratada do departamento de private wealth da Goldman Sachs, com 1,5 mil milhões de dólares em ativos sob gestão. O contínuo influxo de consultores de fortunas independentes mostra que a ligação sistémica de que os grandes corretores tradicionais dependem está a falhar, e a prática independente deixou de ser uma opção marginal para poucos.

A Harvey foca-se em melhorar a eficiência de entrega profissional dentro dos escritórios de advogados; a Farther construiu de raiz uma plataforma independente que permite aos consultores ter acesso a capacidades de back-office iguais ou superiores sem depender dos grandes corretores tradicionais. Ambas têm pontos de partida diferentes, mas estão a redefinir o modo de produção de serviços profissionais. Com o apoio desta plataforma, instrumentos de investimento complexos, como indexação direta e mercados privados, antes limitados aos departamentos de clientes de alto património líquido (UHNW) das grandes instituições, podem agora ser facilmente mobilizados por consultores independentes, alargando enormemente o âmbito de negócio dos profissionais individuais.

O SaaS tradicional só consegue lidar com automatização superficial de processos, como registo e armazenamento, não conseguindo partilhar execuções complexas como decisão e coordenação. Em contraste, os sistemas nativos de IA baseados em arquiteturas multi-agente são naturalmente adequados para absorver as zonas cinzentas entre a execução administrativa e o julgamento lógico não padronizado, como auditoria de conformidade, redação de documentos personalizados e recomendações de alocação de ativos. Estas tarefas, que antes exigiam a colaboração de toda uma equipa de back-office, estão a ser rapidamente digeridas pelo sistema.

O lado do comerciante subestimado: O ciclo fechado de transações no Agentic Commerce

O debate sobre o comércio agente (Agentic Commerce) continua intenso, mas a atenção atual está quase monopolizada pelo lado do consumidor, ou seja, como os assistentes de IA substituem os utilizadores na pesquisa de produtos, comparação de preços e realização automática de encomendas. Em contraste, o feedback prático do lado do comerciante é muito mais frio.

A taxa de conversão do Checkout Instantâneo nativo de IA da Walmart é atualmente apenas um terço da do modelo tradicional de clique e redirecionamento; e a proporção de comerciantes que integraram completamente o sistema de checkout AI do Shopify em 2026 ainda é limitada. Existe uma clara lacuna entre a ativação da procura pela IA e a conclusão real da transação.

A razão para esta lacuna é que a transação agente é um sistema de engenharia. Compreender a intenção do utilizador é apenas o primeiro passo; para converter a procura em receita, é necessário o suporte de toda a cadeia, incluindo verificação de inventário, cálculo de impostos, prevenção de fraudes, cumprimento e liquidação de fundos, capacidades que estão atualmente ainda bloqueadas nos sistemas locais dos comerciantes. Ao mesmo tempo, coexistem vários protocolos de pagamento agente incompatíveis, como UCP, ACP, AP2, Agent Pay, Visa Tokenization, e os comerciantes não têm incentivo para se adaptar a cada um, nem suportam os custos da fragmentação técnica.

A Adyen lançou o Adyen Agentic, que através de três camadas de API modulares, cobre diferentes elos da cadeia de transações:

  • Agentic Feed: responsável pela distribuição padronizada do catálogo de produtos, preços e dados de inventário em tempo real dos comerciantes para as principais plataformas de IA;
  • Agentic Cart: conecta os sistemas de checkout, impostos, cumprimento e gestão de encomendas existentes dos comerciantes ao backend de comércio conversacional;
  • Agentic Payments: trata da verificação de identidade, controlo de riscos de rede e liquidação multicanal em transações lideradas por agentes.

Com uma única integração, a Adyen pode traduzir entre diferentes plataformas e protocolos de agentes de IA, sem necessidade de reconstruir o sistema subjacente sempre que o panorama do mercado muda.

No ecossistema de comércio agente, os laboratórios de IA e as interfaces conversacionais no front-end podem interceptar a intenção e o tráfego dos utilizadores, mas a conversão substancial de valor, a concretização das transações e o fecho do ciclo de fundos dependem fortemente da infraestrutura do lado do comerciante. Em comparação com as entradas front-end altamente competitivas, o serviço de integração sistémica do lado do comerciante tem mais probabilidade de se consolidar como uma infraestrutura subjacente estável e cobrável.

Preocupações das plataformas verticais: A penetração dos fabricantes de modelos e a reconstrução dos custos dos tokens

À medida que o mercado de ferramentas genéricas de baixo custo satura, a lógica comercial dos grandes modelos de plataforma baseada em assinaturas de baixo preço está a mostrar fragilidade. Quando funções genéricas como resumir páginas web e rascunhar e-mails são facilmente substituíveis, as plataformas verticais têm de se concentrar em clientes de alto valor que se importam mais com resultados de negócio. Mas quanto mais se avança para setores de alto valor, mais complexo se torna o ambiente competitivo na camada de aplicação.

Uma das pressões vem da extensão proativa dos limites de negócio dos fabricantes de modelos. A OpenAI e a Anthropic já não se contentam em ser apenas grossistas de APIs; estão a entrar diretamente nos locais dos clientes principais através de equipas de engenharia de campo (FDE). Em abril de 2026, a OpenAI estabeleceu uma parceria com o Customers Bank, com 26 mil milhões de dólares em ativos, colocando uma equipa de engenharia no banco para desenvolver agentes de aprovação de empréstimos e abertura de contas usando dados locais; a Anthropic, por sua vez, colaborou com a gigante de TI financeira FIS, integrando equipas FDE nos seus sistemas internos para desenvolver ferramentas de combate à lavagem de dinheiro, aproveitando o canal da FIS que serve numerosos bancos para alcançar diretamente as áreas mais profundas do negócio bancário.

Este modelo de colaboração no local mostra que os grandes fabricantes de modelos estão a usar canais de infraestrutura para aprender e replicar diretamente os processos de negócio internos de setores de alta barreira.

Outra pressão é a lógica de precificação insustentável dos tokens. Atualmente, a maioria dos tokens dos modelos de fronteira é vendida a preços subsidiados, com prejuízo. Com as chamadas de alta frequência de arquiteturas multi-agente empresariais, quando os subsídios dos grandes fabricantes diminuírem, as plataformas verticais que dependem inteiramente de APIs externas de fronteira não conseguirão suportar as suas faturas de computação.

Esta pressão amplificar-se-á com o aumento das necessidades de inferência. Quando centenas de agentes em funcionamento 24/7 interagem a alta frequência no backend, a procura de poder de computação crescerá exponencialmente, e a cadeia de fornecimento de hardware subjacente, limitada por ciclos de produção extremamente longos, como as máquinas de litografia ASML, não conseguirá acompanhar rapidamente. Para a maioria das operações diárias, usar modelos de fronteira para processar todas as tarefas é, por si só, uma grave má alocação de recursos.

É precisamente por esta razão que a Harvey teve de colaborar com a Applied Compute para estabelecer conjuntos de teste dedicados, sistemas de avaliação privados e pipelines de anotação manual. As plataformas verticais não estão apenas a fazer produtos; estão também a realizar uma complexa engenharia de custos: medir com precisão o consumo de tokens em cada tarefa, determinar quais os passos intermédios que podem ser desviados para modelos pequenos de baixo custo, quais as decisões críticas que necessitam de modelos topo de gama caros e onde a revisão manual deve intervir.

Neste contexto, uma simples camada de interface de workflow bem desenhada já não é suficiente para proporcionar uma vantagem competitiva duradoura. Levar a engenharia de custos ao extremo no backend é a chave para a sobrevivência a longo prazo das plataformas de IA vertical.

Conclusão: A raridade do mercado regressa ao topo da cadeia industrial

Quando os grandes modelos genéricos se tornam tão facilmente acessíveis como a água e a eletricidade, o valor da camada de aplicação de IA começa a concentrar-se no topo e na base da cadeia industrial.

Nesta fase, a escassez do setor não desapareceu: no topo, continua o núcleo que não pode ser padronizado por algoritmos, como a confiança do cliente, julgamentos não padronizados complexos e conhecimento não estruturado escondido na experiência dos profissionais; na base, estão as redes de comerciantes, que suportam dados de produtos, cadeias de conformidade e canais de pagamento. O significado substancial das plataformas verticais é transformar a experiência profissional destes sujeitos de alto valor em capital token que pode ser acumulado de forma sustentável.

Isto também determina que a lógica competitiva da camada de aplicação está a regressar ao pragmatismo. A «narrativa de escala» que sustentou a indústria de software na última década está a falhar perante as restrições rígidas dos custos de computação e da cadeia de fornecimento física.

No novo ciclo, a sobrevivência das empresas de camada de aplicação depende de uma arbitragem precisa entre custos e poder de computação. Com o fim da guerra de preços dos modelos e as limitações de recursos computacionais, as plataformas de aplicação têm de encontrar a solução ótima entre custo e desempenho, em vez de continuar a depender de capital.

Embora os grandes fabricantes de modelos tenham maiores recursos de computação e equipas de engenharia de campo, para as plataformas verticais ágeis e profissionais independentes, a vantagem competitiva mais única continua a ser transformar o seu conhecimento tácito profissional acumulado em ativos sistémicos que os fabricantes de modelos de base não conseguem replicar. Evitar a competição ampla por tráfego e priorizar a realização do ciclo de negócio fechado para sujeitos de produção de alto valor é a lógica que permite à IA vertical sobreviver a longo prazo na era da mercadorização dos grandes modelos.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário