A Anthropic adicionou a funcionalidade de deteção de destilação no Claude Fable 5, consegue bloquear modelos de código aberto chineses?

Anthropic no Claude Fable 5 inclui deteção de destilação, e uma vez que terceiros tentem extrair capacidades do modelo, o sistema recua automaticamente para Opus 4.8, o que equivale a incorporar a "proibição de destilação" nas condições de uso do próprio modelo.
(Preâmbulo: Anthropic acusa furiosamente DeepSeek e outros de AI chinesa de aprender Claude de forma ilícita, usando 24 mil contas falsas para fazer 16 milhões de perguntas)
(Complemento de contexto: Anthropic: só protegendo a liderança em IA nos EUA contra a China é que se pode defender a democracia, propondo que ataques de destilação sejam crime)

Índice deste artigo

Alternar

  • De ameaças legais a bloqueios técnicos
  • O que está a bloquear na destilação?
  • Os verdadeiros limites do bloqueio técnico

O Claude Fable 5 da Anthropic foi oficialmente lançado esta manhã (10), sendo o primeiro modelo de nível Mythos acessível ao público pela Anthropic, com uma pontuação de 80,3% no SWE-Bench Pro, enquanto o Opus 4.8 obteve 69,2%. O preço é de 10 dólares por milhão de tokens de entrada e 50 dólares por milhão de tokens de saída, aproximadamente o dobro do Opus 4.8.

Para além das capacidades do próprio modelo, há um foco de discussão na sua mecanismo de proteção, que incorpora a proibição de destilação no próprio modelo; contudo, o significado simbólico desta ação pode ser muito maior do que o seu efeito prático.

De ameaças legais a bloqueios técnicos

Talvez se lembre de que, em fevereiro deste ano, a Anthropic acusou publicamente a DeepSeek, Moonshot AI e MiniMax de usarem cerca de 24 mil contas falsas para fazer mais de 16 milhões de consultas ao Claude, extraindo sistematicamente outputs para treinar os seus próprios modelos. A OpenAI também fez lobby junto dos legisladores americanos para limitar estas práticas.

Leitura adicional: O que é destilação de modelos de IA? Como a DeepSeek gastou 6 milhões para aprender a fazer 100 milhões

Quatro meses depois, a abordagem do Fable 5 é diferente: usa um classificador de IA para identificar automaticamente três categorias de pedidos de alto risco — cibersegurança, armas químicas e biológicas, e destilação — e, ao detectar uma, devolve a resposta do Opus 4.8. Para técnicas de manipulação de prompts, vetores de steering (que tentam controlar a saída do modelo externamente) e ajuste fino com PEFT, a Anthropic afirma que o Fable 5 também reduz a sua eficácia de forma proativa.

De "querer denunciar-te" a "não te deixar obter", esta é uma atualização estratégica. Mas o problema é que a própria Anthropic admite que mais de 95% das conversas não são afetadas. O mecanismo de proteção cobre apenas cenários muito específicos; a taxa de sucesso na interceptação de tarefas de segurança ofensiva é de 100%, mas os limites da "destilação" permanecem ambíguos — destilação legal e não autorizada são tecnicamente quase idênticas.

O que está a bloquear na destilação?

Voltando à acusação de fevereiro, o investigador de aprendizagem automática Nathan Lambert desmembrou os números reais: cerca de 150 mil consultas da DeepSeek, focadas em modelos de raciocínio e recompensa; a Moonshot cerca de 3,4 milhões, e a MiniMax aproximadamente 13 milhões, totalizando entre 150 e 400 mil milhões de tokens de dados de treino pós-treinamento.

A avaliação de Lambert é que, mesmo com GPU limitada, os laboratórios chineses continuam a ter uma infraestrutura sólida de aprendizagem por reforço (RL); a verdadeira vantagem competitiva está em gerar dados sintéticos de forma "correta e escalável". Em linguagem simples, fazer o modelo aprender por tentativa e erro, sem depender de respostas prontas.

Há ainda uma contradição fundamental: enquanto a Anthropic continuar a vender APIs, a destilação não pode ser completamente bloqueada. Fornecer APIs abertas é o modelo de negócio da Anthropic, e a destilação é uma consequência natural de APIs abertas. A cobertura desta proteção é de 5%, deixando 95% das conversas ainda livres.

Os verdadeiros limites do bloqueio técnico

Lambert explica de forma direta: "Bloquear a destilação é muito mais difícil do que limitar a entrega de hardware físico como GPUs."

Sob esta perspetiva, a proteção do Fable 5 tem duas funções: envia um sinal à indústria de que a fuga tecnológica já atingiu um ponto em que é necessário incorporar a proteção no próprio modelo; e serve como uma interferência para os laboratórios chineses, embora quase não seja uma barreira real. Mesmo que a proteção contra destilação do Fable 5 fosse totalmente eficaz, os laboratórios chineses ainda poderiam confiar na models de código aberto do Google e Meta, na sua infraestrutura de RL própria, e em pipelines de dados sintéticos.

No entanto, a elevação do nível legal para o técnico por parte da Anthropic é um gesto simbólico importante: demonstra que o "bloqueio técnico" está a tornar-se uma nova ferramenta na geopolítica da IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado