Anthropic adiciona função de detecção de destilação no Claude Fable 5, consegue bloquear modelos de código aberto chineses?

Anthropic no Claude Fable 5 adiciona detecção de destilação, uma vez que terceiros tentam extrair capacidades do modelo, o sistema automaticamente reverte para Opus 4.8, como se a "proibição de destilação" estivesse escrita na própria estrutura do modelo.
(Prelúdio: Anthropic acusa com raiva DeepSeek e outros de China de aprender Claude de forma ilícita, usando 24 mil contas falsas para fazer 16 milhões de perguntas)
(Complemento de contexto: Anthropic: só pode proteger a democracia se os modelos de IA dos EUA liderarem a China, propondo que ataques de destilação sejam crimes)

Índice deste artigo

Alternar

  • De ameaças legais a bloqueios técnicos
  • O que o bloqueio de destilação impede?
  • Os verdadeiros limites do bloqueio técnico

O Claude Fable 5 da Anthropic foi oficialmente lançado nesta manhã (10), sendo o primeiro modelo de nível Mythos acessível ao público pela Anthropic, com pontuação de 80,3% no SWE-Bench Pro, enquanto o Opus 4.8 marcou 69,2%. O preço é de 10 dólares por milhão de tokens de entrada e 50 dólares por milhão de tokens de saída, aproximadamente o dobro do Opus 4.8.

Além das capacidades do próprio modelo, há um foco de discussão na sua mecanismo de proteção, que a Anthropic incorporou ao próprio modelo; porém, o significado simbólico dessa ação pode ser maior do que seu efeito prático.

De ameaças legais a bloqueios técnicos

Talvez você lembre que, em fevereiro deste ano, a Anthropic acusou publicamente DeepSeek, Moonshot AI e MiniMax de usar cerca de 24 mil contas falsas para fazer mais de 16 milhões de consultas ao Claude, extraindo sistematicamente saídas para treinar seus próprios modelos. A OpenAI também pressionou legisladores nos EUA para criar leis restritivas.

Leitura adicional: O que é destilação de modelos de IA? Como DeepSeek gastou 6 milhões para aprender habilidades de 100 milhões

Quatro meses depois, a abordagem do Fable 5 foi diferente: usa um classificador de IA para identificar automaticamente três categorias de solicitações de alto risco — segurança, armas químicas e biológicas, e destilação — e, ao detectar uma, devolve a resposta do Opus 4.8. Para técnicas de extração como reescrita de prompts, vetores de direcionamento (tentando manipular a saída do modelo externamente) e ajuste fino com PEFT, o Fable 5 também reduz sua eficácia de forma proativa.

De "querer te denunciar" a "te impedir de usar", essa é uma atualização na estratégia. Mas o problema é que a própria Anthropic admite que mais de 95% das conversas não são afetadas. O mecanismo de proteção cobre apenas cenários muito específicos; a taxa de sucesso na interceptação de tarefas de segurança ofensiva é de 100%, mas a fronteira da "destilação" é ambígua — destilação legal e não autorizada quase se confundem na prática.

O que o bloqueio de destilação impede?

Voltando à acusação de fevereiro. O pesquisador de aprendizado de máquina Nathan Lambert detalhou os números reais: DeepSeek fez cerca de 150 mil consultas, focadas em modelos de raciocínio e recompensa; Moonshot cerca de 3,4 milhões, MiniMax cerca de 13 milhões, totalizando entre 150 e 400 bilhões de tokens de dados pós-treinamento.

Lambert avalia que, mesmo com GPU limitada, os laboratórios chineses continuam tendo uma infraestrutura sólida de aprendizado por reforço (RL); a verdadeira vantagem competitiva está em gerar dados sintéticos de forma "correta e escalável". Em outras palavras, fazer o modelo aprender por tentativa e erro, sem depender de respostas prontas.

Há também uma contradição fundamental: enquanto a Anthropic continuar vendendo APIs, a destilação não pode ser completamente bloqueada. Fornecer APIs abertas é o modelo de negócio da Anthropic, e a destilação é uma consequência natural de APIs abertas. A cobertura dessa proteção é de 5%, enquanto 95% das conversas continuam fluindo livremente.

Os verdadeiros limites do bloqueio técnico

Lambert explica de forma direta: "Bloquear destilação é muito mais difícil do que restringir o envio de hardware físico como GPUs."

Sob essa perspectiva, a proteção do Fable 5 tem dois significados: um sinal para a indústria — a Anthropic acredita que a fuga de tecnologia já atingiu o ponto de precisar ser incorporada ao próprio modelo; e uma interferência para os laboratórios chineses de código aberto, embora quase não seja uma barreira real. Mesmo que a proteção contra destilação do Fable 5 seja totalmente eficaz, os laboratórios chineses ainda podem contar com modelos de código aberto do Google, Meta, infraestrutura própria de RL e pipelines de dados sintéticos.

No entanto, a elevação do movimento da Anthropic de uma ameaça legal para uma ação técnica ainda tem um significado simbólico importante: indica que o "bloqueio técnico" está se tornando uma nova ferramenta na geopolítica da IA.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado