Desde a máquina de litografia EUV, passando por máquinas avançadas de litografia DUV, até o chip H100, em relação às sanções ao semicondutor, o Vale do Silício se dividiu em duas correntes.

Huang Renxun, Su Zifeng e outros têm feito esforços para aliviar as restrições, acreditando que a regulamentação excessiva equivale a entregar o mercado de mãos beijadas, enquanto o CEO da Anthropic, Amodei, é um “fanático” por regulamentação, chegando a comparar chips avançados a armas nucleares.

Huang Renxun já fez várias críticas veladas a Amodei, dizendo que ele tem um “complexo de Deus”. “Comparar IA com armas nucleares, enriquecimento de urânio, é loucura. Nós não estamos refinando urânio, estamos fazendo apenas um pequeno chip,” disse Huang no podcast Dwarkesh Patel.

O “fanático” Amodei talvez não tenha previsto que, um dia, a forte regulamentação que ele defende poderia acontecer justamente na Anthropic — os modelos Mythos e Fable 5, que são de ponta, foram proibidos pelo governo dos EUA de fornecer serviços a qualquer “estrangeiro” no mundo.

Liu Kun comenta no Facebook sobre a proibição do Fable 5

“A loucura de Amodei de temer Mythos/Fable (e todo o campo de IA) finalmente deu frutos: o governo dos EUA proibiu o uso por não-americanos, incluindo estrangeiros que trabalham nos EUA. Quem planta milho, colhe milho,” escreveu Liu Kun, vencedor do Prêmio Turing, no Facebook.

A frase “Quem planta milho, colhe milho” é uma expressão que, no contexto chinês, significa “a consequência de suas ações”. Nos comentários, Liu Kun também zombou que Amodei poderia usar a proibição para se gabar da força de seus modelos.

De acordo com algumas políticas dos EUA, a proibição dos modelos Mythos e Fable não deve durar muito. David Sacks, conselheiro de IA do governo dos EUA, conhecido como “Imperador da IA”, afirmou que isso é apenas uma restrição temporária, e espera que a Anthropic corrija rapidamente as vulnerabilidades de segurança.

Portanto, neste momento, queremos esclarecer neste artigo a origem e o contexto da “proibição de modelos”, as principais controvérsias, os problemas existentes, as possíveis restrições de exportação a longo prazo e o impacto potencial na Anthropic e na indústria de inteligência artificial como um todo.

“Crise de 72 horas”

Muitos filmes americanos gostam de usar “horas” no título para destacar mudanças rápidas em um curto período de tempo. O novo modelo da Anthropic foi lançado e removido em apenas 72 horas, encaixando-se exatamente nesse esquema narrativo.

Em 9 de junho, a Anthropic lançou seu modelo mais poderoso até então, Claude Fable 5 e Claude Mythos 5, sendo este o primeiro modelo de classe “Mythos” da empresa. O Fable 5 é uma versão voltada ao público, com um classificador de segurança: em áreas sensíveis como segurança cibernética, biologia e química, as consultas são automaticamente roteadas para o Opus 4.8, de capacidade mais fraca. Mythos 5, por sua vez, é o mesmo modelo base, mas com restrições de segurança removidas, disponibilizado apenas via Project Glasswing para cerca de 150 organizações revisadas.

Na época, já tinham se passado 2 meses desde a primeira prévia do Mythos.

No blog oficial, a Anthropic afirmou que “a série Fable 5 possui a proteção de segurança mais rigorosa de todos os modelos testados”.

Pliny the Liberator revela risco de “jailbreak” do Fable 5

Apenas um dia depois, o famoso hacker de jailbreak de IA, Pliny the Liberator, publicou uma postagem em maiúsculas no X: “ALERTA DE JAILBREAK, ANTHROPIC VENCIDA, FABLE-5 LIBERADO”. Ele alegou ter burlado o classificador de segurança do Fable 5 usando substituição Unicode, caracteres semelhantes, diluição de contexto longo e técnicas de decomposição e recomposição.

Naquele momento, Amodei provavelmente ainda estava imerso na alegria de ver seu modelo Fable 5 “dominar tudo”, sem perceber o risco anunciado por Pliny. Ele publicou um longo artigo em seu blog pessoal intitulado “Resposta política ao crescimento exponencial da IA”, defendendo que o governo deveria ter o poder de impedir a implantação de modelos de IA inseguros.

Assim como Pliny, um pesquisador da Amazon também descobriu o risco de jailbreak, mas com uma abordagem diferente.

O CEO da Amazon, Andy Jassy, decidiu passar por cima da Anthropic — uma empresa na qual a Amazon investiu pesado — e enviou um relatório de jailbreak ao governo dos EUA.

Vários veículos de mídia revelaram que, no dia seguinte (12 de junho), a Anthropic recebeu uma advertência final do governo americano, sendo instruída a desativar o acesso a dois modelos em 90 minutos. Amodei tentou reverter por telefone, mas acabou recebendo uma ordem de restrição de exportação de emergência.

Na noite de 12 de junho, a Anthropic cumpriu a ordem. Curiosamente, Amodei e sua equipe reforçaram a medida, desconectando o Fable 5 e Mythos 5 globalmente, independentemente de serem americanos ou não.

De 9 a 12 de junho, foi um verdadeiro “crash de 72 horas” para a Anthropic.

Quando compartilhei essa notícia nas redes sociais, citei uma frase clássica de um filme de Hong Kong: “Difícil de resolver, então não resolva”.

Há um espaço para reflexão aqui — por que a Anthropic, ao invés de simplesmente bloquear o acesso de usuários estrangeiros, optou por uma medida drástica de desconexão total? Vale lembrar que a Anthropic nunca foi uma “criança obediente”. No primeiro trimestre, Amodei apresentou seu próprio “Constitutional AI” (AI Constitucional), um conjunto de regras para proteger a IA de usos militares e de vigilância, mesmo que isso signifique abrir mão de contratos com o governo dos EUA.

Sobre a abordagem de “tudo ou nada”, alguns analistas acreditam que a Anthropic não teve tempo suficiente para filtrar usuários, especialmente porque muitos acessam via API, incluindo APIs intermediárias, o que torna a tarefa bastante complexa.

Embora essa explicação seja razoável, ao consultar a política oficial da empresa, é possível perceber que a Anthropic já vem se preparando nesse sentido. Sua política de privacidade mais recente sugere que os usuários precisarão fornecer informações como idade e identidade, o que muitos interpretam como uma possível implementação de reconhecimento facial nos modelos posteriores do Claude. Assim, identificar se o usuário é “americano” ou “estrangeiro” não seria difícil.

Confiança irresistível

“Algumas pessoas analisam a base legal usando o mecanismo de ‘Is informed letter’ (carta de aviso),” disse um pesquisador que acompanha de perto as políticas de exportação.

Nos EUA, a carta de aviso é uma ferramenta administrativa comum da Bureau of Industry and Security (BIS) do Departamento de Comércio, que permite às autoridades emitir notificações rápidas e não públicas para empresas, sem alterar formalmente as regulamentações de exportação, exigindo licença para exportar certos itens ou tecnologias.

No final de 2023, a Nvidia lançou um produto especial, o H20, para o mercado chinês, para contornar restrições de capacidade e largura de banda impostas pelas regras de exportação. Logo depois, a BIS enviou cartas de aviso para Nvidia, AMD e outras, exigindo licenças adicionais para exportar certos chips A, enquanto atualizava as regulamentações de exportação.

No caso da Anthropic, antes de receber a carta de aviso que restringia o acesso de usuários “não-americanos”, o governo dos EUA já havia dado uma orientação de “remoção em 90 minutos”. Segundo a Politico e outros veículos, houve várias rodadas de negociações envolvendo o secretário do Tesouro, o secretário de Comércio e o conselheiro de política de IA do governo, mas a Anthropic recusou a ordem.

Inicialmente, recusou-se a remover os modelos, até que, por fim, a “desconexão total” foi implementada. Essa mudança radical é difícil de explicar apenas por limitações técnicas.

A carta de aviso geralmente é um passo preliminar para a implementação de regras de exportação, mas alguns especialistas acreditam que desta vez o governo não pretende alterar as regulamentações, apenas “parar a Anthropic no caminho”.

Eles argumentam que, no cenário de grandes modelos, ainda não há uma definição clara do que deve ser controlado. “Seria o peso do modelo, o acesso via API, o serviço de inferência ou alguma capacidade abstrata do modelo?”

Historicamente, as restrições de exportação eram mais voltadas a produtos físicos. Mesmo com tecnologia, no final, trata-se de bens tangíveis. Mas, uma vez que o peso do modelo é gerado digitalmente, ele pode se espalhar na esfera digital, tornando difícil uma proibição absoluta.

Assim, “parar a Anthropic” parece uma hipótese razoável. Depois de bloqueá-la, discutir uma governança mais adequada e alinhada faz sentido — e, com base nisso, podemos inferir que Mythos e Fable logo retornarão, o que explica por que David Sacks, o “Imperador da IA”, enfatiza que a “proibição” é apenas temporária.

Por que o governo dos EUA usaria medidas administrativas para interferir no lançamento de modelos de ponta de um laboratório de IA?

A “falha de vulnerabilidade” dos modelos.

Em março, durante uma conversa com Zhou Hongyi, presidente do Grupo Qihoo 360, ele destacou a capacidade da Anthropic de descobrir vulnerabilidades usando IA. “A Anthropic consegue encontrar vulnerabilidades e programar usando IA, resolvendo muitos problemas de segurança que antes eram impossíveis. Por isso, sugeri que devêssemos focar em IA (segurança) e agentes inteligentes.”

O pesquisador mencionado também reforçou que Mythos não se trata de um chatbot comum, mas de uma capacidade altamente especializada de descoberta de vulnerabilidades, análise de rotas de ataque e habilidades ofensivas de rede.

Segurança sem consenso

A Anthropic não só reforçou a ordem de “reforçar a execução” da proibição, como também publicou uma declaração pública.

“Para garantir conformidade, devemos interromper imediatamente todos os planos de usuários,” afirmou a empresa, acrescentando que a suposta “falha de jailbreak” reportada pelo governo e terceiros foi limitada a algumas vulnerabilidades menores previamente conhecidas, que parecem relativamente simples.

Assim, ao revisitar as posições de Amodei, fica claro que sua defesa de que o governo deveria ter o poder de impedir a implantação de IA insegura, assim como a afirmação de que o Fable 5 é o modelo mais seguro, refletem uma confiança absoluta na segurança de seus produtos.

Porém, a Anthropic também deixou uma ressalva: “Atualmente, nenhum fornecedor de modelos consegue garantir proteção total contra jailbreaks,” o que, ao contrário de uma afirmação de segurança absoluta, soa como uma justificativa.

Ou seja, eles afirmam que seus modelos são os mais seguros, e que os modelos inseguros deveriam ser bloqueados pelos órgãos reguladores; que suas vulnerabilidades são geralmente leves e conhecidas; que fazem o máximo para limitar jailbreaks, mas ninguém consegue impedir totalmente.

Por que um modelo que se diz o mais seguro precisa ser lançado mesmo com vulnerabilidades conhecidas? Não seria arriscado? Se não há como bloquear totalmente o jailbreak, por que então pedir restrições a outros modelos?

Quem conhece a Anthropic sabe que a empresa não só tem produtos e capacidades excelentes, mas também adota uma postura bastante agressiva na segurança e governança de IA, quase como uma “criadora de regras” na era da IA, constantemente se colocando como “guardião da segurança”.

Em 19 de setembro de 2023, a Anthropic lançou o RSP 1.0 (Política de Expansão Responsável), defendendo que quanto mais capaz for um modelo, maior deve ser sua segurança. Antes de lançar modelos mais avançados, a empresa deve garantir sua segurança. O documento menciona o mecanismo de classificação de segurança de IA (ASL), com níveis como ASL-1: risco catastrófico sem sentido, ASL-2 com sinais de perigo inicial, mas sem risco catastrófico, e ASL-3 com aumento significativo do risco de uso malicioso.

“Se a escala de IA ultrapassar nossa capacidade de seguir procedimentos de segurança necessários, o quadro ASL nos obrigará a pausar o treinamento de modelos mais poderosos,” escreveu a Anthropic.

Uma semana antes do lançamento do Fable 5, em 4 de junho, a Anthropic publicou um artigo intitulado “Quando a IA se auto-modela”, pedindo uma “pausa ativa” para evitar riscos de melhorias recursivas na IA.

Pouco tempo depois, o Fable 5 foi lançado.

Se olharmos para essa linha do tempo, parece uma situação cômica — como se um estudante brilhante dissesse “nunca reviso para o exame”, mas na prática estivesse fazendo uma preparação intensa.

Se há preocupações, por que lançar o modelo mais avançado logo após pedir uma pausa? Essa é uma questão. Na verdade, o modelo Mythos já tinha uma prévia há dois meses. Se sua capacidade é tão revolucionária, por que não se pediu uma pausa na época?

Aparentemente, a Anthropic adota uma postura agressiva em relação à segurança, mas essa postura de apelo à segurança parece mais uma estratégia de contenção de adversários. Enquanto fala em regulamentar modelos inseguros e pede pausa no treinamento de modelos de ponta, ela mesma continua iterando e avançando.

Se em 2023 a Anthropic era mais idealista com o RSP 1.0, em 2025, com o RSP 2.2, ela se tornou mais realista.

No changelog do RSP 2.2, há uma modificação que exclui “insiders sofisticados” e “insiders comprometidos pelo estado” do padrão de segurança ASL-3, além de remover a proteção contra ataques de destilação (distillation attacks) do ASL-2.

Pesquisei essa mudança: ela significa que, no futuro, ataques internos e de atores estatais não serão considerados ameaças de segurança de padrão rígido. Em outras palavras, a Anthropic silenciosamente “baixou” seus padrões de segurança, deixando de se comprometer a resistir às ameaças mais difíceis.

Em 9 de fevereiro de 2026, o chefe de segurança da Anthropic, Mrinank Sharma, renunciou. Em sua carta, escreveu: “O mundo está em perigo. Durante meu mandato, vi como é difícil fazer os valores realmente guiarem as ações da organização… Estamos sob pressão constante para abrir mão do que é mais importante.”

Poucos dias após, em 24 de fevereiro, a Anthropic lançou o RSP 3.0, reescrevendo completamente sua estratégia de segurança e removendo todas as menções a “pausas”.

Na essência, como mencionado antes, a Anthropic nunca acionou uma pausa de treinamento. Isso é semelhante à carta pública de março de 2023, assinada por Elon Musk, pedindo uma pausa de seis meses no treinamento de modelos acima do GPT-4. Musk foi um participante ativo, assinando a carta, fundando a xAI e, em novembro, lançando o Grok-1.

Assim, os laboratórios de grandes modelos não têm um “consenso de segurança”. As pausas são, na verdade, estratégias comerciais.

Impulsionados pelo capital

Com o lançamento do Fable 5, o preço de entrada e saída é de US$10 e US$50 por milhão de tokens, respectivamente, o que é o dobro do Opus 4.8, embora com 90% de desconto na cache hits.

Ao conversar com um pesquisador do campo de IA, ele comentou: “Funciona bem, mas é caro de verdade.” Assim, há uma tendência de que os modelos nacionais estejam tentando “acelerar” para oferecer inferência mais rápida e maior TPS (Token por segundo), além de aumentar preços de forma moderada.

Voltando à Anthropic, em maio de 2021, Amodei saiu da OpenAI com sua irmã e 14 pesquisadores, fundando a Anthropic, e conseguiu levantar US$1,24 bilhão na rodada A, com uma avaliação de US$550 milhões. Em 5 anos, em 2025, a rodada de financiamento Série H elevou a avaliação para US$96,5 bilhões, com receita de aproximadamente US$9 bilhões (ARR). No primeiro trimestre de 2026, a receita foi de US$4,8 bilhões, e documentos obtidos pelo Wall Street Journal indicam que a Anthropic planeja uma IPO no quarto trimestre, levantando US$60 bilhões. Com uma receita anual estimada em mais de US$40 bilhões, a avaliação de US$96,5 bilhões implica um múltiplo de 24 vezes o ARR, exigindo crescimento exponencial de receita.

Nesse contexto, qualquer compromisso de segurança, como “pausar o treinamento se a capacidade for excedida”, funciona como um freio ao crescimento da receita. Com uma avaliação de 24x o ARR, qualquer pausa pode impactar drasticamente o valor.

Por isso, a exclusão de “pausas” no RSP 3.0 não é mera coincidência, mas uma estratégia de capitais — na fase de IPO, qualquer potencial “freio” deve ser removido, como mostra a própria documentação de conformidade.

Se mantivessem o “compromisso de pausa”, o prospecto de IPO teria que incluir um aviso de risco: “A empresa promete pausar o desenvolvimento se a capacidade ultrapassar limites de segurança desconhecidos”, o que poderia assustar investidores, pois indicaria que a receita pode “zerar” a qualquer momento.

Com uma avaliação de US$96,5 bilhões e pressão de IPO, a Anthropic enfrenta o dilema de priorizar interesses dos acionistas em detrimento do interesse público.

Na hora de ajustar sua estrutura, a discussão mais acalorada foi sobre a PBC — Public Benefit Corporation (Empresa de Interesse Público), uma estrutura de governança adotada pela Anthropic. Segundo esse modelo, um fundo de benefício de longo prazo (LTBT) pode nomear 2-3 membros do conselho, mas até o final de 2024, apenas um membro foi nomeado, e em 2025, mais um. Somente com a aproximação do IPO, o ex-CEO da Novartis, Vas Narasimhan, entrou no conselho, elevando a proporção de membros do LTBT para 4 de 7.

Surpreendentemente, um dos membros nomeados pelo trust, Jay Kreps (cofundador e CEO da Confluent, nomeado pelo trust em maio de 2024), anunciou sua renúncia após apenas um ano de mandato.

A relação de poder entre o “trust” e a gestão + investidores voltou a ficar equilibrada em 3-3. Antes que um novo membro do LTBT seja nomeado, qualquer divergência pode criar um “vácuo de governança”.

O “sétimo membro” chegará antes do IPO?

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
MyGateTradeStory
809,51K Popularidade
#
WarshDebutsAsFedHoldsRatesSteady
1,43M Popularidade
#
IsraelStrikesIranBTCPlunges
58,91K Popularidade
#
PredictWorldCup🇺🇸vs🇵🇾
884,78K Popularidade
#
TradFiCFDGoldMaster
1,05M Popularidade

Fixado

sitemap

Fãs entusiastas do embargo de chips enfrentam proibição de modelos

“Crise de 72 horas”

Confiança irresistível

Segurança sem consenso

Impulsionados pelo capital

Tendências

MyGateTradeStory

WarshDebutsAsFedHoldsRatesSteady

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

TradFiCFDGoldMaster

Fixado