Anthropic adiciona função de detecção de destilação no Claude Fable 5, consegue bloquear modelos de código aberto chineses?

Question

Anthropic no Claude Fable 5 adiciona detecção de destilação, uma vez que terceiros tentam extrair capacidades do modelo, o sistema automaticamente reverte para Opus 4.8, como se a "proibição de destilação" estivesse escrita na própria estrutura do modelo.
(Prelúdio: Anthropic acusa com raiva DeepSeek e outros de China de aprender Claude de forma ilícita, usando 24 mil contas falsas para fazer 16 milhões de perguntas)
(Complemento de contexto: Anthropic: só pode proteger a democracia se os modelos de IA dos EUA liderarem a China, propondo que ataques de destilação sejam crimes)

Índice deste artigo

Alternar

De ameaças legais a bloqueios técnicos
O que o bloqueio de destilação impede?
Os verdadeiros limites do bloqueio técnico

O Claude Fable 5 da Anthropic foi oficialmente lançado nesta manhã (10), sendo o primeiro modelo de nível Mythos acessível ao público pela Anthropic, com pontuação de 80,3% no SWE-Bench Pro, enquanto o Opus 4.8 marcou 69,2%. O preço é de 10 dólares por milhão de tokens de entrada e 50 dólares por milhão de tokens de saída, aproximadamente o dobro do Opus 4.8.

Além das capacidades do próprio modelo, há um foco de discussão na sua mecanismo de proteção, que a Anthropic incorporou ao próprio modelo; porém, o significado simbólico dessa ação pode ser maior do que seu efeito prático.

De ameaças legais a bloqueios técnicos

Talvez você lembre que, em fevereiro deste ano, a Anthropic acusou publicamente DeepSeek, Moonshot AI e MiniMax de usar cerca de 24 mil contas falsas para fazer mais de 16 milhões de consultas ao Claude, extraindo sistematicamente saídas para treinar seus próprios modelos. A OpenAI também pressionou legisladores nos EUA para criar leis restritivas.

Leitura adicional: O que é destilação de modelos de IA? Como DeepSeek gastou 6 milhões para aprender habilidades de 100 milhões

Quatro meses depois, a abordagem do Fable 5 foi diferente: usa um classificador de IA para identificar automaticamente três categorias de solicitações de alto risco — segurança, armas químicas e biológicas, e destilação — e, ao detectar uma, devolve a resposta do Opus 4.8. Para técnicas de extração como reescrita de prompts, vetores de direcionamento (tentando manipular a saída do modelo externamente) e ajuste fino com PEFT, o Fable 5 também reduz sua eficácia de forma proativa.

De "querer te denunciar" a "te impedir de usar", essa é uma atualização na estratégia. Mas o problema é que a própria Anthropic admite que mais de 95% das conversas não são afetadas. O mecanismo de proteção cobre apenas cenários muito específicos; a taxa de sucesso na interceptação de tarefas de segurança ofensiva é de 100%, mas a fronteira da "destilação" é ambígua — destilação legal e não autorizada quase se confundem na prática.

O que o bloqueio de destilação impede?

Voltando à acusação de fevereiro. O pesquisador de aprendizado de máquina Nathan Lambert detalhou os números reais: DeepSeek fez cerca de 150 mil consultas, focadas em modelos de raciocínio e recompensa; Moonshot cerca de 3,4 milhões, MiniMax cerca de 13 milhões, totalizando entre 150 e 400 bilhões de tokens de dados pós-treinamento.

Lambert avalia que, mesmo com GPU limitada, os laboratórios chineses continuam tendo uma infraestrutura sólida de aprendizado por reforço (RL); a verdadeira vantagem competitiva está em gerar dados sintéticos de forma "correta e escalável". Em outras palavras, fazer o modelo aprender por tentativa e erro, sem depender de respostas prontas.

Há também uma contradição fundamental: enquanto a Anthropic continuar vendendo APIs, a destilação não pode ser completamente bloqueada. Fornecer APIs abertas é o modelo de negócio da Anthropic, e a destilação é uma consequência natural de APIs abertas. A cobertura dessa proteção é de 5%, enquanto 95% das conversas continuam fluindo livremente.

Os verdadeiros limites do bloqueio técnico

Lambert explica de forma direta: "Bloquear destilação é muito mais difícil do que restringir o envio de hardware físico como GPUs."

Sob essa perspectiva, a proteção do Fable 5 tem dois significados: um sinal para a indústria — a Anthropic acredita que a fuga de tecnologia já atingiu o ponto de precisar ser incorporada ao próprio modelo; e uma interferência para os laboratórios chineses de código aberto, embora quase não seja uma barreira real. Mesmo que a proteção contra destilação do Fable 5 seja totalmente eficaz, os laboratórios chineses ainda podem contar com modelos de código aberto do Google, Meta, infraestrutura própria de RL e pipelines de dados sintéticos.

No entanto, a elevação do movimento da Anthropic de uma ameaça legal para uma ação técnica ainda tem um significado simbólico importante: indica que o "bloqueio técnico" está se tornando uma nova ferramenta na geopolítica da IA.

Ver original

Anthropic adiciona função de detecção de destilação no Claude Fable 5, consegue bloquear modelos de código aberto chineses?

De ameaças legais a bloqueios técnicos

O que o bloqueio de destilação impede?

Os verdadeiros limites do bloqueio técnico

Tendências

GateIPOAccessSpaceX

AnthropicReleasesFable5Model

IsraelStrikesIranBTCPlunges

BlackRockReducesBTCIncreasesETH

SpaceXIPOAttractsOver250BillionInOrders

Fixado