Engenheiro da Anthropic pede desculpas: foi meu erro zombar da previsão de "faturação por uso de poder de computação de IA"

robot
Geração de resumo em curso

Resumo do Evento

Um engenheiro da Anthropic pediu desculpas publicamente, dizendo que estava errado ao zombar da afirmação “o poder computacional de IA acabará sendo cobrado por uso”. Ele explicou que a escalabilidade é realmente difícil, e os preços atuais e as limitações de uso são escolhas necessárias, não uma tentativa de enganar.

Situação Específica

  • Parte interessada: Thariq Shihipar (@trq212), que trabalha no Claude Agent SDK
  • Ele disse em resposta a @weswinder que não deveria ter zombado da observação de @Pranit sobre “o poder computacional de IA ser cobrado como água e eletricidade”
  • A sua atitude: não houve engano, o problema é que a escalabilidade é realmente difícil, e a abordagem atual é “a melhor solução que conseguimos pensar até agora”
  • Causa da controvérsia: @Pranit criticou a estrutura de preços em camadas da Anthropic (com um nível a 200 dólares/mês), o que gerou uma discussão sobre os custos da infraestrutura de IA
  • Referência da indústria: a Cursor também frequentemente aciona limites de taxa durante os picos, e está constantemente otimizando a eficiência

O que isso significa: Um engenheiro de linha de frente reconheceu um problema que os usuários há muito reclamam - escalar sistemas de agentes é realmente difícil, e a empresa ainda está tentando equilibrar custos, desempenho e usabilidade.

Por que faz sentido

  • Shihipar participou diretamente do desenvolvimento de funcionalidades como subagentes e verificação cíclica, o que significa que ele fala com base em experiência pessoal, não em suposições
  • @Pranit apontou que, tanto a estrutura de preços em camadas da Anthropic quanto o pool de API Pro/Ultra+ da Cursor estão essencialmente próximos do “cobrança por uso” - porque os custos de inferência flutuam muito. Isso está relacionado à discussão sobre o consumo de poder computacional dos fluxos de trabalho de agentes em 2026
  • O conflito central está em:
    • As tarefas estão se tornando cada vez mais complexas (refatoração de código, raciocínio em múltiplas etapas)
    • Os fornecedores devem encontrar um equilíbrio entre eficiência e capacidade, e durante os picos, são forçados a limitar a velocidade
    • Algumas técnicas a nível de SDK (como liberar contexto gradualmente) podem aliviar o problema, mas não resolvem a raiz
  • Os ajustes de preços e limites da Cursor também refletem o mesmo problema - os usuários intensivos têm uma grande demanda de inferência, e os limites se esgotam rapidamente

Avaliação de Impacto

  • Importância: Média
    • Por que vale a pena prestar atenção: Esta é uma perspectiva técnica da linha de frente de desenvolvimento, que confirma a verdadeira dificuldade da escalabilidade de agentes. Tem valor de referência para desenvolvedores e equipes técnicas na escolha de tecnologias e planejamento de arquitetura.

Resumo dos Pontos

  • Conclusão principal:

    1. Dificuldade de escalabilidade é a principal razão: Os preços atuais e as limitações de uso são compromissos diante da realidade da engenharia, não uma tentativa de enganar
    2. Cobrança está se aproximando do modelo por uso: Os custos e a demanda flutuam muito, e o design em camadas + pooling é difícil de evitar
    3. Limitação de velocidade durante picos é um sintoma, não a causa: O problema fundamental é que o consumo de recursos dos complexos fluxos de trabalho de agentes é difícil de prever
    4. Ferramentas podem aliviar, mas não resolver a raiz: Técnicas como liberações graduais de contexto ajudam, mas o conflito entre desempenho e custo ainda persiste
  • Sugestões para diferentes pessoas:

    • Desenvolvedores/Arquitetos:
      • Reservar quotas, projetar planos de degradação
      • Prestar atenção nas ferramentas de eficiência do SDK (subagentes, verificação cíclica, corte de contexto)
    • Produto e Aquisição:
      • Avaliar a janela de tempo real disponível para “camadas + limitação de uso”
      • Prestar atenção no nível de serviço e nas oscilações de experiência durante picos
    • Ecossistema de Código Aberto/Ferramentas:
      • Diferenciar-se em transparência de custos e gestão de recursos

Avaliação: A tendência de “o poder computacional de IA se dirigir para a cobrança por uso” ainda está em uma fase inicial. Os que mais se beneficiarão são os desenvolvedores e equipes técnicas das empresas que buscam estabilidade e controle de custos. Antes que o problema da escalabilidade seja resolvido, quem conseguir gerenciar recursos, estratégias de limitação e otimização de fluxos de trabalho terá vantagem.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar