Anthropic en Claude Fable 5 ha añadido la función de detección de destilación, ¿puede bloquear los modelos de código abierto chinos?

Question

Anthropic en Claude Fable 5 añade detección de destilación, y una vez que un tercero intenta extraer capacidades del modelo, el sistema automáticamente retrocede a Opus 4.8, lo que equivale a incorporar la "prohibición de destilación" en los términos de uso directamente en el modelo.
(Resumen previo: Anthropic acusa a DeepSeek y otros AI chinos de aprender de Claude de manera ilícita, usando 24,000 cuentas falsas para realizar 16 millones de consultas)
(Información adicional: Anthropic: Solo liderando en IA en EE. UU. frente a China para proteger la democracia, propone que los ataques de destilación sean delitos penales)

Índice de este artículo

Alternar

De amenazas legales a bloqueos técnicos
¿Qué se bloquea al impedir la destilación?
Los verdaderos límites del bloqueo técnico

Claude Fable 5 de Anthropic fue lanzado oficialmente esta mañana (10), siendo el primer modelo de nivel Mythos abierto al público por Anthropic, con una puntuación de 80.3% en SWE-Bench Pro, mientras que Opus 4.8 obtuvo 69.2%. El precio es de 10 dólares por millón de tokens de entrada y 50 dólares por salida, aproximadamente el doble de Opus 4.8.

Además de las capacidades del modelo en sí, hay un foco de discusión en el mecanismo de protección que trae consigo: Anthropic ha incorporado la "prohibición de destilación" en el propio modelo; pero el significado simbólico de esta acción puede ser mucho mayor que su efecto real.

De amenazas legales a bloqueos técnicos

Quizá recuerdes que en febrero de este año, Anthropic acusó públicamente a DeepSeek, Moonshot AI y MiniMax de usar aproximadamente 24,000 cuentas falsas para realizar más de 16 millones de consultas a Claude, extrayendo sistemáticamente salidas para entrenar sus propios modelos. OpenAI también presionó a legisladores en EE. UU. para que legislaran en contra.

Lectura adicional: ¿Qué es la destilación de modelos de IA? Cómo DeepSeek gastó 6 millones para aprender a hacer 100 millones

Cuatro meses después, la estrategia de Fable 5 fue diferente: usa clasificadores de IA para identificar automáticamente tres tipos de solicitudes de alto riesgo, como ciberseguridad, armas biológicas y químicas, y destilación, y cuando detecta alguna, devuelve respuestas de Opus 4.8. Para técnicas como reescritura de prompts, vectores de dirección (herramientas para manipular la salida del modelo desde fuera) y ajuste fino con PEFT, Anthropic dice que Fable 5 también reduce su efectividad de forma activa.

De "querer denunciarte" a "no poder acceder a ti", esto representa una escalada estratégica. Pero el problema es que Anthropic también admite que más del 95% de las conversaciones no se ven afectadas. El mecanismo de protección cubre solo escenarios muy específicos; la tasa de éxito en bloquear tareas de seguridad activa es del 100%, pero los límites de la "destilación" son borrosos, ya que la destilación legal y la no autorizada casi no se diferencian en la práctica.

¿Qué se bloquea al impedir la destilación?

Volviendo a la acusación de febrero, el investigador en aprendizaje automático Nathan Lambert desglosó las cifras reales: DeepSeek realizó aproximadamente 150,000 consultas, dirigidas a modelos de inferencia y recompensa; Moonshot unas 3.4 millones, MiniMax unas 13 millones, y en total, los datos de entrenamiento posteriores equivalen a entre 150 y 400 mil millones de tokens.

La conclusión de Lambert es que, incluso en entornos con GPU limitadas, los laboratorios chinos mantienen una infraestructura sólida para aprendizaje por refuerzo (RL); la verdadera ventaja competitiva radica en generar datos sintéticos "de manera correcta y escalable". En términos simples, hacer que el modelo aprenda a hacer las cosas mediante ensayo y error, sin depender de respuestas preexistentes.

Y hay una contradicción fundamental: mientras Anthropic siga vendiendo API, la destilación no puede ser completamente bloqueada. La API abierta es el modelo de negocio de Anthropic, y la destilación es simplemente un subproducto natural de una API abierta. La protección cubre solo el 5%, dejando el 95% restante de conversaciones en flujo.

Los verdaderos límites del bloqueo técnico

Lambert lo dice claramente: "Bloquear la destilación será mucho más difícil que restringir la exportación de hardware físico como GPUs."

Desde esta perspectiva, las medidas de protección de Fable 5 tienen dos significados: una señal para la industria, indicando que la fuga tecnológica ha llegado a un punto en que debe integrarse en el propio modelo; y una interferencia para los laboratorios chinos de código abierto, aunque casi no representa un obstáculo. Incluso si la protección contra la destilación de Fable 5 fuera perfecta, los laboratorios chinos aún podrían apoyarse en modelos de código abierto de Google, Meta, infraestructura propia de RL y pipelines de datos sintéticos.

Sin embargo, la escalada de Anthropic desde el nivel legal al técnico también tiene un significado simbólico importante: demuestra que el "bloqueo técnico" se está convirtiendo en una nueva herramienta en la geopolítica de la IA.

Ver original

Anthropic en Claude Fable 5 ha añadido la función de detección de destilación, ¿puede bloquear los modelos de código abierto chinos?

De amenazas legales a bloqueos técnicos

¿Qué se bloquea al impedir la destilación?

Los verdaderos límites del bloqueo técnico

Temas de actualidad

GateIPOAccessSpaceX

AnthropicReleasesFable5Model

IsraelStrikesIranBTCPlunges

BlackRockReducesBTCIncreasesETH

SpaceXIPOAttractsOver250BillionInOrders

Fijado