Futuros
Aceda a centenas de contratos perpétuos
CFD
Ouro
Plataforma de ativos tradicionais globais
Opções
Hot
Negoceie Opções Vanilla ao estilo europeu
Conta Unificada
Maximize a eficiência do seu capital
Negociação de demonstração
Introdução à negociação de futuros
Prepare-se para a sua negociação de futuros
Eventos de futuros
Participe em eventos para recompensas
Negociação de demonstração
Utilize fundos virtuais para experimentar uma negociação sem riscos
Lançamento
CandyDrop
Recolher doces para ganhar airdrops
Launchpool
Faça staking rapidamente, ganhe potenciais novos tokens
HODLer Airdrop
Detenha GT e obtenha airdrops maciços de graça
Pre-IPOs
Desbloquear acesso completo a IPO de ações globais
Pontos Alpha
Negoceie ativos on-chain para airdrops
Pontos de futuros
Ganhe pontos de futuros e receba recompensas de airdrop
Investimento
Simple Earn
Ganhe juros com tokens inativos
Investimento automático
Invista automaticamente de forma regular.
Investimento Duplo
Aproveite a volatilidade do mercado
Soft Staking
Ganhe recompensas com staking flexível
Empréstimo de criptomoedas
0 Fees
Dê em garantia uma criptomoeda para pedir outra emprestada
Centro de empréstimos
Centro de empréstimos integrado
Promoções
Centro de atividades
Participe de atividades para recompensas
Referência
20 USDT
Convide amigos para recompensas de ref.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Announcements
Atualizações na plataforma em tempo real
Blog da Gate
Artigos da indústria cripto
Serviços VIP
Enormes descontos nas taxas
Gestão de ativos
Solução integral para a gestão de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicações Gate
Transferência Bancária OTC
Deposite e levante moeda fiduciária
Programa de corretora
Mecanismo generoso de reembolso de API
AI
Gate AI
O seu parceiro de IA conversacional tudo-em-um
Gate AI Bot
Utilize o Gate AI diretamente na sua aplicação social
GateClaw
Gate Lagosta Azul, pronto a usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
Mais de 10 mil competências
Do escritório à negociação, uma biblioteca de competências tudo-em-um torna a IA ainda mais útil
GateRouter
Escolha inteligentemente entre mais de 40 modelos de IA, com 0% de taxas adicionais
OpenAI consome fortemente a camada de aplicação? a16z: as oportunidades estão além do "Caminho de Tijolos Amarelos", as oportunidades para os empreendedores ainda estão na retaguarda
a16z sócio aponta que a camada de aplicações de IA não é um campo único de batalha, startups devem evitar ferramentas horizontais de grandes modelos e focar em setores verticais aprofundados. Este artigo é baseado em uma postagem no Twitter.
(Resumindo: Google lidera o investimento na plataforma de roteamento de IA OpenRouter, avaliada em 1,3 bilhões de dólares, com crescimento de 240% ao ano)
(Complemento: Sam Altman conversa com o fundador da a16z: OpenAI aposta agressivamente em infraestrutura, Sora é uma ferramenta estratégica importante)
Índice deste artigo
Alternar
Essa é exatamente a questão que Joe Schmidt, parceiro da a16z, tenta responder neste artigo. Ele usa a metáfora do "caminho de tijolos amarelos" de "O Mágico de Oz" para dividir as oportunidades de IA em duas categorias: uma é o caminho principal que os laboratórios de grandes modelos estão trilhando, como geração de código, escrita, geração de imagens, agentes gerais e assistentes de escritório horizontais; a outra é "outros lugares em Oz", ou seja, cenários verticais que aprofundam processos industriais, dependem de fluxos de trabalho complexos, dados acumulados, conformidade, governança e integração de sistemas.
Na visão dele, a verdadeira oportunidade para startups está na segunda.
De vendas a seguros, Joe Schmidt reforça repetidamente uma lógica: o que as empresas realmente querem pagar não é uma janela de chat mais inteligente, mas um sistema responsável pelos resultados de negócio. Ele precisa entender o estado confuso dos dados do cliente, lidar com múltiplas aprovações e casos limites, assumir responsabilidades de conformidade e auditoria, além de ajudar na migração, roteamento e otimização de custos à medida que o modelo evolui.
Essa é também a principal conclusão do artigo sobre o software empresarial de próxima geração: os modelos de base ficarão cada vez mais poderosos e substituíveis; mas o que realmente não pode ser substituído são os dados, processos, capacidades de governança e memórias operacionais acumuladas ao redor de setores específicos e fluxos de trabalho concretos. As oportunidades de empresas de aplicações de IA não estão em disputar o "caminho de tijolos amarelos" com as empresas de modelos, mas em entrar naqueles lugares mais complexos, mais sujos, mais lentos, porém mais próximos do valor real de negócio.
Recentemente, tenho ouvido repetidamente de fundadores e potenciais funcionários a mesma dúvida: ainda há o que fazer na camada de aplicações de IA? Ou será que OpenAI e Anthropic acabarão por eliminar tudo?
Por trás dessa dúvida há uma ansiedade típica de IA. Alguns já concluíram: se não quisermos nos tornar eternamente dependentes de infraestrutura, o único lugar de valor a longo prazo é dentro de laboratórios de grandes modelos ou em startups de robótica, hardware ou fronteiras tecnológicas — ou seja, fazer aquilo que "não dá para experimentar" em laboratórios. Porque, se toda categoria de software for engolida, seja por Codex ou Claude, ou por um modelo futuro que torne certas tarefas obsoletas, a melhor estratégia parece ser: correr rápido!
Confesso que também sou quase um extremista de IA, e acho que eles têm razão em parte. Os laboratórios de grandes modelos estão de fato entrando em áreas amplas da camada de aplicações. Mas "camada de aplicações" não é um conjunto homogêneo de oportunidades. O critério chave é: você está trilhando o "caminho de tijolos amarelos" ou está em outros lugares em Oz.
O chamado "caminho de tijolos amarelos" é a metáfora que usamos para descrever a rota que os laboratórios de grandes modelos estão trilhando, investindo recursos maciços. Geração de código, escrita, criação de imagens são problemas naturalmente adequados a laboratórios, porque eles melhoram à medida que a capacidade original do modelo evolui: cada dólar investido em pré-treinamento e pós-treinamento melhora diretamente a qualidade do produto.
Por outro lado, em outros lugares em Oz, há problemas mais complexos, geralmente mais verticais. Não se trata apenas de oferecer uma ferramenta horizontal para um usuário empresarial, que basta conectar a ferramentas padrão e usar suas habilidades de computador. O valor aqui vem mais das estruturas ao redor do modelo: scaffolds que tornam as saídas confiáveis, conformes, integradas ao fluxo de trabalho. A capacidade bruta do modelo é importante, mas já não é tudo.
Estamos vendo isso acontecer em tempo real. OpenAI e Anthropic estão admitindo que não podem resolver todos os problemas com um colaborador de IA universal. Anunciaram investimentos massivos em projetos de implantação front-line, construindo soluções completas para configurar e customizar modelos para empresas. Se achassem que a próxima versão do modelo resolveria tudo, não investiriam bilhões nesses projetos.
Ansiedade se espalha: grandes modelos dominam a camada de aplicações?
Portanto, se você quer ganhar dinheiro com aplicações de IA, não trilhe o caminho de tijolos amarelos, mas vá para outros lugares em Oz. Aqui estão algumas experiências que nós e alguns fundadores do nosso portfólio aprenderam na prática.
Se você quer fundar uma empresa, o caminho de tijolos amarelos é o mais visível, mas também o mais perigoso. Pegue um modelo de alto desempenho, conecte com alguns conectores prontos, como Google Drive, Slack, Salesforce, Notion, GitHub, e construa uma camada de orquestração inteligente. Parece magia.
O problema é que isso é exatamente o que os laboratórios de grandes modelos fazem com Cowork e Codex. Obviamente, eles têm modelos, o que lhes dá maior margem de lucro, controle mais forte e poder de precificação sobre todos os downstream. Mas talvez o mais importante seja que eles controlam as arquiteturas que definem quais problemas o produto deve resolver. Até agora, eles têm adotado deliberadamente o padrão "modelo + chamada de ferramenta", que é exatamente o que esses caminhos de tijolos amarelos horizontais, de tarefas com poucos passos, precisam. Mesmo que uma startup consiga superar Codex ou Claude Code, os laboratórios ainda têm uma enorme capacidade de distribuição e o maior halo de marca na área de IA.
Se você é uma startup de aplicações de IA, usando a mesma abordagem: conectando-se aos mesmos conectores, sem uma camada de subinteligências ou configurações, sem canais de distribuição, provavelmente está trilhando um caminho para o vazio.
Por outro lado, as startups podem encontrar oportunidades gigantes fora do caminho de tijolos amarelos. Elas podem atender clientes nesses cenários e resolver problemas complexos.
Essas empresas estão construindo experiências com inteligência integrada: modelos embutidos em ferramentas complexas, automações e redes de integração — ou seja, software. Isso faz com que a maioria dessas startups seja naturalmente verticalizada. Elas podem focar em fluxos de trabalho com múltiplos passos, múltiplos participantes, projetar subinteligências específicas para diferentes papéis e setores, lidando com problemas que plataformas horizontais como Anthropic e OpenAI não conseguem alcançar: coletando contexto de múltiplos sistemas, roteando tarefas para diferentes aprovadores em diferentes etapas.
Esse tipo de trabalho geralmente envolve sistemas legados, exige resultados determinísticos, pois imprecisão não é aceitável, e às vezes está ligado a resultados comerciais críticos. Os laboratórios de grandes modelos sabem o valor dessas questões: por isso, estão formando suas próprias equipes de configuração terceirizada, e também surgem grupos de empresas de RLHF (Reinforcement Learning com Feedback Humano) voltadas a grandes clientes.
Uma objeção a esse ponto de vista é: até agora, apostar em modelos ou laboratórios que não evoluem é uma péssima estratégia. Eles continuarão evoluindo, ficando mais fortes, e eventualmente engolirão esses mercados atendidos por aplicações.
Claro que os laboratórios vão continuar evoluindo. Mas, a longo prazo, empresas em Oz podem adotar algumas estratégias defensivas.
Muita do conhecimento que você internaliza na sua operação não está em nenhum conjunto de treinamentos: práticas não documentadas, padrões não registrados, conhecimento tribal que vive na cabeça dos profissionais. Tudo isso não está na internet pública. Nenhum volume de treinamento vai substituir o trabalho de realmente mergulhar nesses fluxos de trabalho.
Aqui, entram dois círculos viciados: um é o círculo de clientes, ou seja, quanto mais variantes de um problema você encontrar, mais seu padrão se beneficiará de efeito de alavancagem; o outro é o círculo interno do cliente, ou seja, as razões por trás das decisões, as exceções não explicitadas, as regras internas da empresa, que só aparecem na interação real com o sistema.
Armadilha do caminho de tijolos amarelos: ferramentas horizontais estão condenadas
Mesmo que os dados do cliente não possam ser usados entre clientes, a empresa de aplicações pode usar o reconhecimento de padrões de diferentes tipos de problemas para orientar o design de futuros fluxos. Se uma startup já fez mil vezes uma tarefa, como modificar uma linha de risco legal ou ajustar uma dica de qualificação de lead, ela já entende o formato do problema de uma forma que um novato não consegue copiar.
Teoricamente, um sistema horizontal também pode criar uma infraestrutura de aprendizado semelhante. Mas, além de falta de foco, o que mais impede isso é a experiência do usuário. Capturar esse conhecimento depende totalmente de como você oferece a interface de fluxo de trabalho. Os players verticais podem projetar interfaces que expõem informações essenciais para tarefas específicas, algo que ferramentas horizontais não conseguem fazer. Conjuntos de avaliação, rotulagem de saídas, sistemas de classificação de casos limites podem formar um ciclo de dados verticalizado, apoiando ajustes finos. Sem uma infraestrutura de produção de escala semelhante, é difícil gerar esse ciclo. Sua viabilidade depende de direitos de dados, volume de uso e contratos com clientes, mas o reconhecimento de padrões continuará acumulando.
Laboratórios de grandes modelos já fazem roteamento: chamam modelos diferentes para diferentes tipos de solicitações, usando integração de modelos na base. Mas eles não fazem roteamento entre fornecedores, nem avaliam modelos concorrentes para tarefas específicas, nem usam modelos open source ajustados para tarefas estreitas.
Empresas em Oz, por sua vez, escolhem o melhor modelo para cada tarefa, no mercado de modelos, e não apenas usam o modelo de um laboratório. Elas também assumem tarefas que ninguém quer fazer: reavaliar modelos toda vez que um novo é lançado, ajustar prompts para casos limites de clientes, colocar em produção sem quebrar o ambiente. Os laboratórios não fazem isso por você. Eles vendem o novo modelo e dizem para você migrar. Empresas em Oz absorvem esses custos de migração. O cliente recebe o melhor conjunto de capacidades de IA do mercado, com continuidade a cada atualização.
Enviar cada consulta para Opus 4.7 é o caminho mais rápido para prejuízo. As melhores empresas de Oz fazem roteamento entre diferentes níveis de modelos: tarefas mais difíceis vão para modelos de ponta, a maior parte para modelos intermediários, e tarefas já comprovadas para modelos menores ou ajustados.
Algumas dessas empresas já fazem seu próprio pós-treinamento, otimizando modelos para as tarefas específicas que o cliente realmente valoriza, oferecendo a custos muito menores do que APIs de ponta. Os laboratórios de grandes modelos praticam preços de "piso": quanto X dólares compram o nível mínimo de inteligência. Empresas de Oz vendem o oposto: o nível de inteligência necessário para uma tarefa específica, ao menor custo possível. Isso só é viável quando você sabe exatamente o que cada sub-tarefa precisa de inteligência. Como os laboratórios não conhecem todos os detalhes de cada setor, essa diferenciação leva a preços mais baixos e mais controlados.
Ser o plano de controle de IA de um cliente em um setor vertical gera valor significativo. Esse plano de controle é o ponto onde se concentram permissões, auditorias, o que a inteligência pode fazer e o que realmente foi feito.
Esse plano de controle se baseia em limites específicos de cada caso de uso, que variam entre setores e cargos. Como essas empresas têm ferramentas, fluxos de trabalho e dados com contato direto com a inteligência, podem oferecer resultados confiáveis de uma forma que ferramentas horizontais não conseguem. Também assumem a complexidade regulatória do cliente: regras federais de litígio civil nos EUA, regras de prática jurídica, HIPAA na saúde, SEC e FINRA no financeiro, regulamentações estaduais de seguros, etc. Se um player horizontal não se transformar em uma centena de setores verticais, não conseguirá fazer isso de forma convincente. O CIO precisa de um parceiro que possa assumir a conformidade, com cláusulas contratuais claras.
Tudo isso, no final, se resume a uma coisa: foco.
Esse foco pode ser uma indústria vertical, como seguros, jurídico, contabilidade; ou uma função aprofundada, como vendas, atendimento ao cliente, finanças. Em qualquer caso, exige uma equipe que esteja há muito tempo no mesmo tipo de cliente, entendendo seu fluxo, suas exceções e suas regulações. Os laboratórios de grandes modelos não foram criados para isso. Eles precisam atender a todos, cobrir tudo, e essa é a razão de terem trilhado o caminho de tijolos amarelos inicialmente. Essa escolha também limita sua entrada em outros lugares em Oz: você pode estar em todos os lugares, ou ser excelente em uma coisa só, mas não as duas ao mesmo tempo.
Na prática, como entender isso? Aqui estão algumas recomendações práticas do CEO Prabhav Jain, da 11x.
Oportunidades em Oz: barreira de proteção de fluxos de trabalho verticais
Construir uma empresa resistente ao impacto dos laboratórios de grandes modelos é possível começando pelos resultados concretos que os clientes realmente valorizam. Para nós, esse resultado é gerar mais leads e oportunidades de vendas.
A partir daí, a questão fica muito específica: quais atividades queremos controlar do começo ao fim, que realmente impulsionam o crescimento do pipeline? Que tarefas podem ser feitas por inteligência, e quais não? Quais requerem insights profundos de domínio, e quais não? Os laboratórios de grandes modelos também oferecem fluxos de trabalho, mas quando uma tarefa tem muitos passos, entrada confusa, estado difícil de explicar ou restrições do mundo real, ter um modelo melhor sozinho não resolve. Aí, o trabalho volta à engenharia de software tradicional, onde os laboratórios não têm vantagem.
Por exemplo, algumas tarefas que lidamos incluem: identificar potenciais clientes com sinais customizados, completar informações de leads, pesquisa aprofundada de contas, extrair contexto do CRM, criar textos para diferentes canais, sistemas de avaliação de qualificação de leads, e sistemas de entrega de emails. Algumas são tarefas de IA, outras não. Essas tarefas não se resolvem com uma única prompt, requerem engenharia avançada.
A grande insight em Oz é: na maioria dos fluxos de trabalho reais, cerca de metade das tarefas não envolvem IA, e essa metade não traz vantagem de laboratório. Fora do modelo, elas são apenas programação determinística, não mais forte que sua capacidade de escrever software. A outra metade, que envolve IA, também exige que você foque no resultado desejado, ajustando, treinando e restringindo o modelo.
Conhecimento de domínio geralmente não está nos dados de treinamento genéricos. Precisa ser construído de dentro para fora, a partir do setor ou função específica, alimentando o modelo na hora certa do fluxo de trabalho. Quando nosso IA avalia uma oportunidade por telefone, ela precisa entender: para um setor específico, um perfil de usuário, o que constitui uma boa conversa de vendas. Essa é a tarefa do aplicativo, e essa capacidade se beneficia de efeito de alavancagem.
Mais importante, essas capacidades ficam desatualizadas à medida que a empresa evolui. Portanto, evoluir continuamente os fluxos de trabalho e o contexto se torna uma vantagem competitiva. Quando começamos a fazer campanhas de email em escala, "IA escrevendo emails" era novidade. Hoje, as pessoas já têm um feeling aguçado para distinguir se um email foi escrito por IA ou por um humano, e essa percepção muda a cada poucos meses. Nosso IA precisa se ajustar às dinâmicas do mercado, e a barreira de proteção está aí. Apesar dessa mudança constante, nossa taxa de resposta aumentou 4 vezes nos últimos meses, gerando bilhões de dólares em pipeline.
Problemas complexos são onde o valor de negócio realmente se revela. Caso contrário, você acaba só criando uma camada superficial de embalagem.
Ao decompor problemas de negócio suficientemente complexos, logo aparece a confusão. Um exemplo simples do GTM: se uma empresa já é sua cliente, você não deveria mais contatar um contato específico dentro dela. Mas isso não é simples.
Talvez seu CRM tenha o domínio da empresa. E se ela tiver várias subsidiárias? E se o CRM tiver o domínio da matriz? E se um campo desatualizado no Salesforce fizer você enviar um email frio ao CFO de um cliente existente? Os dados do mundo real são caóticos. Humanos têm dificuldade para lidar com isso, modelos também não vão passar por essa barreira magicamente. Para criar ordem nesse caos, é preciso projetar IA específica para o problema, não apenas apontar uma IA genérica para o CRM. Na verdade, com os dados que temos, percebemos que nossa qualidade e atualidade de dados já superam a do próprio cliente, então, por padrão, usamos nossos dados como âncora.
As barreiras de conformidade estão subestimadas. Mesmo dentro de um produto, cada caso de uso precisa de suas próprias restrições. Para nós, um lead financeiro regulado difere completamente de um cliente SaaS de médio porte. Essas garantias se propagam para como a IA escreve, quem ela pode contatar, quais dados ela acessa, o que ela pode dizer ao telefone, e como cada decisão é registrada.
Um sistema "one size fits all" colapsaria diante dessas diferenças. As restrições precisam ser construídas por caso de uso, configuradas por cliente, e continuamente auditadas. Essa é uma tarefa que cabe à startup. Por isso, precisamos de engenheiros de implantação e estrategistas de deployment, ajustando tudo para cada cliente.
Vantagem de custo: roteamento de modelos e pós-treinamento
Por exemplo, trabalhamos com uma instituição Fortune 1000, usando IA de voz para chamadas autorizadas a seus clientes SMB. Nas primeiras tentativas, a taxa de atendimento era baixa. Precisamos iterar rápido, aprendendo a fazer com que esse público interagisse nos primeiros 10 segundos da chamada. Os comportamentos de SMBs são bem diferentes de grandes compradores B2B ou consumidores. Hoje, geramos mais oportunidades por dia para eles do que toda a equipe de vendas do segmento em um mês.
Vendas é só um exemplo. Seguros é outro, ilustrando a mesma ideia. Aqui está a visão do CEO Aman Gour, da FurtherAI, sobre "sair do caminho de tijolos amarelos".
Quando começamos a implantar IA na operação real de seguros, uma hipótese comum era: o modelo é a inteligência, o fluxo de trabalho é só uma estrutura ao redor dele.
Mas, quanto mais trabalhamos com seguradoras, mais acreditamos que o oposto é verdadeiro.
Na indústria de seguros, muita inteligência já está no fluxo de trabalho. Duas seguradoras podem seguir o mesmo caminho de submissão: enviar, revisar, cotar, aprovar. O caminho é fácil. O que diferencia as seguradoras é tudo que está dentro do fluxo: quais riscos precisam de escalonamento, quais sinais de perda são críticos, qual regra de subscrição prevalece quando há conflito, quando é preciso assinatura humana, quais dados externos consultar, como registrar a decisão final.
Essas lógicas não estão em um motor de regras limpo. Estão dispersas em processos operacionais, revisões gerenciais, filosofias de subscrição, preferências específicas de cada seguradora, e anos de experiência operacional. Muitas dessas regras não estão escritas em um formato que a IA possa ler diretamente.
Por isso, não acreditamos em IA que raciocina do zero toda vez, nem em fluxos rígidos que colapsam na complexidade. Pelo contrário, construímos fluxos de trabalho inteligentes. Eles trazem repetibilidade, auditabilidade e controle de custos; a IA lida com variabilidade e retoma o fluxo quando o caminho ideal é interrompido; humanos permanecem onde há julgamento e responsabilidade.
No começo, essa automação cobre tarefas humanas. Com o tempo, cada melhoria vira um sinal, cada exceção uma retroalimentação, cada correção uma atualização do manual. No longo prazo, o fluxo de trabalho deixa de ser só código, vira memória operacional da seguradora.
Essa é a parte que os laboratórios de grandes modelos não conseguem alcançar. Eles continuam lançando modelos melhores, IA mais geral, e devem fazer isso. Mas não ficarão anos em um fluxo de trabalho de uma seguradora, aprendendo por que uma conta foi escalada, por que um risco foi rejeitado ou por que um underwriter mudou de opinião — e, mais importante, por que ele estava certo.
Essa compreensão só vem de executar o mesmo fluxo milhares de vezes na operação real. O que você entregou no primeiro dia não é uma barreira. A continuidade na operação ao longo do tempo é que constrói a barreira.
Para nós, essa é a essência de "sair do caminho de tijolos amarelos".
Plano de controle: valor de conformidade e governança
Quantas etapas essa tarefa exige? Quão complexas são as ferramentas necessárias?
Compare um sistema horizontal de IA que busca no Google Drive: uma operação de uma etapa, com alta tolerância a erro. O usuário lê o resumo, se errar, pergunta de novo.
Agora, uma tarefa de revisão de limites legais baseada em precedentes de um escritório de advocacia nos últimos três anos: pode envolver dezenas de etapas, múltiplas ferramentas, saída que precisa passar por revisão de sócio, e até ser usada em tribunal. Ambos parecem "uma IA fazendo o trabalho", mas só a segunda exige uma infraestrutura de software construída por uma equipe focada, ao longo de anos.
Você está construindo um sistema que o cliente usa para fazer o trabalho, ou apenas adicionando uma camada de IA ao sistema dele?
Um sistema tem fluxo de trabalho completo: captura de dados, governança, registro de tarefas. Quando o cliente descreve como o trabalho acontece, aponta para esse sistema. A ferramenta é só uma camada de inteligência adicional ao fluxo existente.
Produtos de ferramenta também geram receita real, mas os laboratórios de grandes modelos tendem a levar essa receita, pois o cliente não depende de você como camada de orquestração. Produtos de sistema, com alto valor de contrato, substituem trabalho humano real e, por isso, podem cobrar por isso. Mas não há garantia absoluta. Você deve se perguntar: se um laboratório lançar um produto concorrente, o cliente ainda precisará da sua ferramenta? Se sim, você está construindo um sistema. Se não, você é uma ferramenta — mesmo com alto valor de contrato.
O desempenho de laboratórios de grandes modelos é avaliado por benchmarks; o desempenho de empresas em Oz é avaliado pelo impacto no resultado financeiro do cliente.
Os clientes não se importam com a pontuação no SWE-Bench ou no MMLU. Eles querem saber se sua IA fechou negócios, ajustou contratos, aprovou apólices corretas. Se eles se importam com o resultado de um fluxo de trabalho específico, você está em Oz. Se compram por capacidade geral, estão comprando o que podem obter de Claude ou Codex.
As melhores empresas de IA funcionam como fundos de hedge: ganham com alpha, que é avaliado na linha de resultado do cliente, não em scores de benchmark.
Veremos grandes vencedores tanto na rota de tijolos amarelos quanto fora dela. Modelos continuarão vencendo, pois têm modelos e capacidade de distribuição bem projetada.
Empresas em Oz também podem vencer, desde que tenham sistemas de trabalho: interfaces de execução, fluxo de dados, captura de informações. Essas empresas, ao aprofundar fluxos complexos em setores verticais, criam experiências essenciais para o cliente. Com o lançamento de novos modelos por players existentes e novos entrantes, essas empresas se tornam as que integram esses modelos e entregam ao cliente. Os modelos de base são substituíveis, mas os sistemas de trabalho não.
A próxima geração de software empresarial será construída fora do caminho de tijolos amarelos.