Anthropic en Claude Fable 5 ha añadido la función de detección de destilación, ¿puede bloquear los modelos de código abierto chinos?

Anthropic en Claude Fable 5 añade detección de destilación, y una vez que un tercero intenta extraer capacidades del modelo, el sistema automáticamente retrocede a Opus 4.8, lo que equivale a incorporar la "prohibición de destilación" en los términos de uso directamente en el modelo.
(Resumen previo: Anthropic acusa a DeepSeek y otros AI chinos de aprender de Claude de manera ilícita, usando 24,000 cuentas falsas para realizar 16 millones de consultas)
(Información adicional: Anthropic: Solo liderando en IA en EE. UU. frente a China para proteger la democracia, propone que los ataques de destilación sean delitos penales)

Índice de este artículo

Alternar

  • De amenazas legales a bloqueos técnicos
  • ¿Qué se bloquea al impedir la destilación?
  • Los verdaderos límites del bloqueo técnico

Claude Fable 5 de Anthropic fue lanzado oficialmente esta mañana (10), siendo el primer modelo de nivel Mythos abierto al público por Anthropic, con una puntuación de 80.3% en SWE-Bench Pro, mientras que Opus 4.8 obtuvo 69.2%. El precio es de 10 dólares por millón de tokens de entrada y 50 dólares por salida, aproximadamente el doble de Opus 4.8.

Además de las capacidades del modelo en sí, hay un foco de discusión en el mecanismo de protección que trae consigo: Anthropic ha incorporado la "prohibición de destilación" en el propio modelo; pero el significado simbólico de esta acción puede ser mucho mayor que su efecto real.

De amenazas legales a bloqueos técnicos

Quizá recuerdes que en febrero de este año, Anthropic acusó públicamente a DeepSeek, Moonshot AI y MiniMax de usar aproximadamente 24,000 cuentas falsas para realizar más de 16 millones de consultas a Claude, extrayendo sistemáticamente salidas para entrenar sus propios modelos. OpenAI también presionó a legisladores en EE. UU. para que legislaran en contra.

Lectura adicional: ¿Qué es la destilación de modelos de IA? Cómo DeepSeek gastó 6 millones para aprender a hacer 100 millones

Cuatro meses después, la estrategia de Fable 5 fue diferente: usa clasificadores de IA para identificar automáticamente tres tipos de solicitudes de alto riesgo, como ciberseguridad, armas biológicas y químicas, y destilación, y cuando detecta alguna, devuelve respuestas de Opus 4.8. Para técnicas como reescritura de prompts, vectores de dirección (herramientas para manipular la salida del modelo desde fuera) y ajuste fino con PEFT, Anthropic dice que Fable 5 también reduce su efectividad de forma activa.

De "querer denunciarte" a "no poder acceder a ti", esto representa una escalada estratégica. Pero el problema es que Anthropic también admite que más del 95% de las conversaciones no se ven afectadas. El mecanismo de protección cubre solo escenarios muy específicos; la tasa de éxito en bloquear tareas de seguridad activa es del 100%, pero los límites de la "destilación" son borrosos, ya que la destilación legal y la no autorizada casi no se diferencian en la práctica.

¿Qué se bloquea al impedir la destilación?

Volviendo a la acusación de febrero, el investigador en aprendizaje automático Nathan Lambert desglosó las cifras reales: DeepSeek realizó aproximadamente 150,000 consultas, dirigidas a modelos de inferencia y recompensa; Moonshot unas 3.4 millones, MiniMax unas 13 millones, y en total, los datos de entrenamiento posteriores equivalen a entre 150 y 400 mil millones de tokens.

La conclusión de Lambert es que, incluso en entornos con GPU limitadas, los laboratorios chinos mantienen una infraestructura sólida para aprendizaje por refuerzo (RL); la verdadera ventaja competitiva radica en generar datos sintéticos "de manera correcta y escalable". En términos simples, hacer que el modelo aprenda a hacer las cosas mediante ensayo y error, sin depender de respuestas preexistentes.

Y hay una contradicción fundamental: mientras Anthropic siga vendiendo API, la destilación no puede ser completamente bloqueada. La API abierta es el modelo de negocio de Anthropic, y la destilación es simplemente un subproducto natural de una API abierta. La protección cubre solo el 5%, dejando el 95% restante de conversaciones en flujo.

Los verdaderos límites del bloqueo técnico

Lambert lo dice claramente: "Bloquear la destilación será mucho más difícil que restringir la exportación de hardware físico como GPUs."

Desde esta perspectiva, las medidas de protección de Fable 5 tienen dos significados: una señal para la industria, indicando que la fuga tecnológica ha llegado a un punto en que debe integrarse en el propio modelo; y una interferencia para los laboratorios chinos de código abierto, aunque casi no representa un obstáculo. Incluso si la protección contra la destilación de Fable 5 fuera perfecta, los laboratorios chinos aún podrían apoyarse en modelos de código abierto de Google, Meta, infraestructura propia de RL y pipelines de datos sintéticos.

Sin embargo, la escalada de Anthropic desde el nivel legal al técnico también tiene un significado simbólico importante: demuestra que el "bloqueo técnico" se está convirtiendo en una nueva herramienta en la geopolítica de la IA.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado