Os custos da API dispararam, os desenvolvedores começaram a trazer a inferência de volta para local, e a infraestrutura Web3 beneficia-se inesperadamente.

robot
Geração de resumo em curso

As faturas do modelo de ponta estão a empurrar os programadores para o local

Elon Musk mencionou que, no cenário OpenClaw, ele queima diariamente cerca de 200 dólares em custos do modelo. Isto não é apenas uma questão de gastar dinheiro — reflecte uma tendência maior: os programadores estão a transitar de soluções puramente na nuvem para um encaminhamento híbrido de local + nuvem. Há cada vez mais histórias semelhantes: as facturas de API são demasiado altas, as empresas não aguentam, e então os programadores transferem tarefas do dia-a-dia e fluxos de trabalho que podem ser processados em lote para o local, deixando apenas o que é verdadeiramente difícil para os modelos de ponta.

Vitalik Buterin cortou recentemente para o Qwen3.5, que corre em hardware Nvidia e com isolamento em sandbox; a velocidade de inferência pode chegar a 90 tokens por segundo, e não passa por cloud pública. Isto vai ao encontro do relatório da CertiK — eles descobriram que, na capacidade do OpenClaw, cerca de 15% das intenções de “tirar dinheiro” vêm com malícia. Privacidade e segurança já não são temas da margem.

Quanto ao tweet viral de Marc Andreessen sobre “psicose de IA”, diga-se a verdade, não tem muito a ver com adopção real. O motor central continua a ser a contabilidade económica: de acordo com estimativas da comunidade, ao executar modelos open source localmente para tarefas não críticas, o custo pode ser reduzido em cerca de 90%.

  • O encaminhamento híbrido tornou-se a opção por defeito: como desenvolvedores como Matthew Berman, ao levar tarefas como extracção de texto para o local, apenas tarefas difíceis como geração de código ficam para o modelo de ponta. Os custos descem drasticamente, e o espaço de lucro das APIs para laboratórios é comprimido.
  • Os problemas de segurança estão a remodelar a proposta de valor: a abordagem de Vitalik é “aprovação dupla: humano + LLM”, juntamente com um limite diário de 100 dólares para o montante da carteira. Ele trata a autonomia do Agent como um risco que precisa de controlo, e não como um argumento de venda incremental. Isto também está a impulsionar projectos Web3 (como 0G Labs) a fornecer saídas verificáveis.
  • A IA Web3 está a ser ignorada: enquanto toda a gente olha para Polymarket e Bitcoin, projectos como o Bertram The Pomeranian do ecossistema Solana estão a combinar Meme e ferramentas de IA. O papel da cripto na infra-estrutura de Agents descentralizados ainda não foi visto com seriedade pelo mercado.

O entusiasmo pelos Agents encontra os custos reais

Este tema espalhou-se devido à resposta de Andreessen à “pânico de IA”. Os optimistas citam o Clawptimizer.ai, que diz que consegue poupar 90% de custos; os cépticos ampliam os avisos da CertiK sobre sequestro de sessões por plugins. O resultado é: o OpenClaw está a crescer rapidamente, mas esta faca de dois gumes — os dados do GitHub estão muito fortes — pode atrasar a velocidade de adopção se o isolamento de sandbox e permissões não for bem feito.

Entretanto, os pontos de extremidade gratuitos da NVIDIA Moonshot Kimi e as opções de VPS abaixo de 5 dólares/mês também confirmam a opinião de Musk: a precificação de modelos de ponta de 5–25 dólares por milhão de tokens, em cenários de execução de Agents 24/7, é simplesmente insustentável. A inferência local em AMD Ryzen consegue chegar a 51 tokens por segundo; a relação custo-benefício das soluções locais está a melhorar.

O lado dos fundos ainda não precificou esta migração híbrida. Os compradores empresariais querem mais “IA verificável” do que “pura capacidade de computação”, o que torna soluções open source flexíveis mais atractivas do que plataformas fechadas.

Perspectiva Evidência O que significa para a indústria O meu parecer
Orientada para custos (Berman, comunidade) Modelo de ponta a 200 dólares/dia vs. MiniMax local a 788 dólares/ano; encaminhamento local a correr resumos e outras tarefas Da nuvem total para inferência em camadas; lucros de API a encolher Subestimado: a arquitectura híbrida reduz o risco de expansão, e os laboratórios terão de baixar preços ou perder clientes
Orientada para segurança (Vitalik, CertiK) 15% de competências maliciosas; injecção de JS em plugins conduz à carteira a ser “esvaziada” Os Agents são tratados como superfície de ataque, acelerando a adopção de ferramentas de autonomia Um pouco exagerado, mas existe mesmo: não é o fim do mundo, mas a aprovação dupla vai tornar-se padrão
Optimistas em Web3 (0G Labs, etc.) Bertram e outros projectos de AI+Crypto em destaque; provas ao nível de L1 para saídas verificáveis A cripto actua como camada de privacidade e verificação, atraindo programadores de IA para perto da infra-estrutura DeFi Subestimado: a combinação de IA×Web3 pode fazer emergir um conjunto de novos protocolos na ordem dos 10 mil milhões de dólares
Anti-fraude (tweet “psychosis” de Andreessen) Não tem relação directa com adopção real Para baixar a temperatura emocional, trazendo a discussão de volta para custos e verificabilidade Ruído: o foco deve estar nos custos e na verificabilidade

Conclusão central: Este tweet controverso, na prática, mostra o ponto de inflexão da IA híbrida. Para controlar custos e proteger a privacidade, os Builder’s já começaram a adoptar um modelo de “prioridade ao local + orquestração de ponta”. Mas o lado financeiro e o mercado secundário ainda não acompanharam. A autoridade dos laboratórios está a ser lentamente diluída pelas ferramentas de autonomia e pelo “stack” verificável. Para as empresas, contornar o lock-in de API através de camadas verificáveis via Web3 é uma escolha mais inteligente.

Importância: alta
Categoria: tendências da indústria / segurança de IA / ferramentas para programadores

Conclusão: Os Builder e os fundos de médio/longo prazo ainda têm vantagem de primeiro-mover neste sentido. Se fundos puramente transaccionais apostarem apenas em plataformas de API closed source, o rumo está errado — e já é tarde. A arquitectura híbrida com prioridade ao local e infra-estrutura verificável será a fonte de retornos acima do esperado nos próximos 12–24 meses.

0G-3,39%
SOL-2,84%
BERT-5,02%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar