Mythos pré-visualiza trazer o setor de volta à defesa: a base de segurança do DeFi abala, recursos de IA fluem para a pista de controle de riscos

robot
Geração de resumo em curso

Mythos faz a indústria de IA virar para a defesa: alguns problemas-chave emergem

Deedy Das, aquele tweet, não só gerou discussão, mas também trouxe toda a indústria de volta do “quão forte é o modelo” para “o que modelos fortes podem fazer e como regular”. Segundo informações públicas, o Mythos Preview obteve 99/100 no BenchLM, pontuação máxima em tarefas de proxy, cerca de 94% na referência de codificação SWE-bench, claramente superior ao Claude Opus 4.6. Relatos indicam que esse modelo, com menos de 50 dólares de poder computacional, identificou uma vulnerabilidade do OpenBSD de 27 anos atrás e conseguiu montar uma cadeia de vulnerabilidades do kernel Linux. Karpathy, LeCun e outros ainda não se pronunciaram publicamente, possivelmente porque o modelo ainda não foi disponibilizado para pesquisadores independentes.

Minha avaliação: a atenção da indústria está mudando de “subir na tabela de desempenho” para “defesa e controle”. A Anthropic, por meio do Project Glasswing, está tentando estabelecer uma entrada limitada, querendo resolver primeiro as questões de uso duplo.

  • A entrada corporativa criou uma lacuna de recursos e informações: o Glasswing já envolve mais de 40 parceiros (Apple, Microsoft estão entre eles), com um limite de 100 milhões de dólares para cenários de segurança; projetos open source têm dificuldade em obter recursos semelhantes.
  • A hipótese de segurança do DeFi está sendo questionada: contratos na blockchain controlam cerca de 200 bilhões de dólares. Após a perda de 285 milhões de dólares na Solana com Drift, o programa de segurança STRIDE foi lançado. Ferramentas de detecção de vulnerabilidades de IA estão ficando cada vez mais fortes, e protocolos que não fizeram validação formal serão avaliados pelos depositantes com uma precificação de risco mais rigorosa.
  • O capital está seguindo a direção do “IA responsável”: após a rodada G da Anthropic, a avaliação implícita é de cerca de 3,8 trilhões de dólares, indicando preferência por segurança. Ainda é preciso ver se o RSP 3.0 realmente impedirá abusos.

Pontuações não são tudo: a decisão de lançar depende do limiar de segurança e do controle

A compra por empresas avalia se é possível lançar com segurança, não a classificação na tabela. Após vazamentos, o setor de segurança cibernética recuou entre 5% e 10%, e, com poucos concorrentes contestando publicamente, isso mostra que o mercado valoriza mais “defesa/gestão de risco” do que “capacidade”.

Perspectiva Base Mudança Avaliação
Orientação por capacidade BenchLM 99/100, primeira em tarefas de proxy, testes internos mostram cadeia de vulnerabilidades do Firefox Expectativa dos desenvolvedores para codificação de IA e fluxos de trabalho de proxy aumentam Pode estar superestimado; confiabilidade em produção e pontuação são coisas diferentes
Prioridade na segurança Aliança Glasswing, descoberta de vulnerabilidades de dia zero (como uma vulnerabilidade do FFmpeg de 16 anos atrás) Foco em pontos frágeis na infraestrutura, avanço na auditoria de segurança assistida por IA Subestimado; a credibilidade da Anthropic como parceiro de segurança aumenta, concorrentes têm dificuldade de acompanhar
Cautela do mercado Recuo em ações de segurança, perda de 285 milhões de dólares na Solana Investidores reavaliando riscos de disseminação em 6–18 meses Razoável a curto prazo; tecnologias defensivas de longo prazo podem oferecer retornos excessivos
Limiar de segurança Avaliação RSP ainda não atingiu o limiar de autonomia, mas o modelo ainda não foi testado publicamente Indústria regulada prefere modelos auditados e lançamentos controlados Estrutura eficaz; pouco amigável para pesquisadores, mas compradores regulados preferem

O consenso está se consolidando: ao invés de perguntar “o que a IA ainda pode fazer”, é melhor perguntar “como fazer ela atuar dentro dos limites”.

Informações-chave

  • Mythos tem alta capacidade, mas só oferece testes piloto para empresas: alta pontuação em benchmarks, amostras reais de dia zero, além de entrada inicial para empresas, formando uma combinação de “alta capacidade + acesso restrito”.
  • Risco no DeFi está sendo reprecificado: contratos de alto valor enfrentam aceleração na defesa e ataque por IA, e validações formais e auditorias de segurança por IA passarão a ser requisitos de entrada.
  • Capital e narrativa estão ligados: capital, talentos se concentram em “modelos fortes e controláveis”, enquanto o ecossistema aberto e a pesquisa independente ficam cada vez mais marginalizados.
  • A lógica de decisão de lançamento está mudando: limiares de segurança, isolamento e auditabilidade estão substituindo a pontuação na tabela como principais critérios de compra empresarial.

Importância: alta
Classificação: lançamento de modelos|segurança de IA|impacto de mercado

Conclusão: empresas e investidores já estão pagando pelo posicionamento defensivo da Anthropic; construtores que não priorizam integração de segurança e pesquisadores sem canais corporativos estão assumindo riscos de marginalização crescente.

Avaliação: do ponto de vista narrativo, ainda estamos em uma fase “pré-coleta, mas acelerando”; os maiores beneficiados são construtores com capacidade de segurança e canais regulatórios. Traders secundários devem observar mais as mudanças na implementação de segurança e nos padrões de entrada; para participantes que só possuem exposição ao ecossistema aberto, essa conjuntura é desfavorável.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar