Fanáticos de la prohibición de chips enloquecen y enfrentan bloqueos de modelos

Autor: Su Yang, Tencent Technology

Desde la máquina de litografía EUV, pasando por la avanzada máquina de litografía DUV, hasta el chip H100, en el tema de las restricciones a semiconductores, Silicon Valley se ha dividido en dos bandos.

Huang Renxun, Su Zifeng y otros han estado abogando por aliviar los controles, considerando que la regulación excesiva equivale a ceder el mercado, mientras que el CEO de Anthropic, Amodei, es un “fanático de la regulación”, que en su momento comparó los chips avanzados con armas nucleares.

Huang Renxun ha hecho varias críticas indirectas a Amodei, diciendo que tiene un “complejo de dios”. “Comparar la IA con armas nucleares, enriquecimiento de uranio, es una locura; no estamos refinando uranio enriquecido, solo hacemos un pequeño chip”, dijo Huang en el podcast Dwarkesh Patel.

El “fanático” Amodei probablemente no esperaba que la regulación estricta que tanto enfatizaba algún día se aplicara a Anthropic — dos modelos de vanguardia, Mythos y Fable 5, fueron prohibidos por el gobierno de EE. UU para ofrecer servicios a cualquier “extranjero” en todo el mundo.

Liu Kun en Facebook comenta sobre la prohibición de Fable 5

“La absurda campaña de miedo de Amodei sobre Mythos/Fable (y todo el campo de la IA) finalmente ha dado sus frutos: el gobierno de EE. UU prohíbe a los no estadounidenses usarlos, incluso a empleados extranjeros que trabajan en EE. UU. La cosecha que siembra, la cosecha que recoge”, escribió Liu Kun, ganador del Premio Turing, en Facebook.

“Cosecha la que siembras”, en el contexto chino, puede interpretarse como “recibir lo que se siembra”. Luego, en los comentarios, Liu Kun bromeó que Amodei podría aprovechar la prohibición para alardear de lo poderosa que es su modelo.

Según algunas políticas de EE. UU., la prohibición de Mythos y Fable no durará mucho. David Sacks, asesor de IA en la Casa Blanca, conocido como el “emperador de la IA”, dijo que esto es solo una restricción temporal y espera que Anthropic corrija rápidamente las vulnerabilidades de seguridad.

Por ello, en este momento, queremos analizar en este artículo el origen y desarrollo de la “prohibición de modelos”, los principales debates, los problemas existentes, la posible regulación de exportaciones a largo plazo y el impacto potencial en Anthropic y toda la industria de la inteligencia artificial.

“Crisis de 72 horas”

Muchas películas estadounidenses usan la palabra “hora” para destacar cambios drásticos en un corto período de tiempo. El modelo más potente de Anthropic, desde su lanzamiento hasta su retirada, Fable 5, duró exactamente 72 horas, en este marco narrativo.

El 9 de junio, Anthropic lanzó su modelo más fuerte hasta la fecha, Claude Fable 5 y Claude Mythos 5, siendo estos los primeros modelos de “clase Mythos” de Anthropic. Fable 5 es la versión pública, con un clasificador de seguridad: en áreas sensibles como ciberseguridad, biología y química, las consultas se enrutan automáticamente a Opus 4.8, de menor capacidad. Mythos 5, en cambio, es el mismo modelo base, pero sin restricciones de seguridad, solo accesible a unas 150 organizaciones revisadas a través de Project Glasswing.

A ese momento, ya habían pasado 2 meses desde la primera vista previa de Mythos.

En el blog oficial, Anthropic afirmó que “la serie Fable 5 tiene la protección de seguridad más estricta entre todos los modelos probados”.

Pliny the Liberator revela riesgos de “salto de jaula” en Fable 5

Pero solo un día después, el famoso hacker de modelos de IA, Pliny the Liberator, publicó en X en mayúsculas: “ALERTA DE SALTO DE JAULA, ANTHROPIC DOMINADO, FABLE-5 LIBERADO”. Aseguró haber evadido la clasificación de seguridad de Fable 5 mediante reemplazo con Unicode, caracteres homónimos, dilución de contexto largo y técnicas de descomposición y recomposición.

En ese momento, Amodei probablemente aún disfrutaba de la alegría de que su modelo Fable 5 “superaba a todo”, sin notar el riesgo que Pliny había advertido, y publicó un extenso artículo en su blog personal titulado “Respuesta política al crecimiento exponencial de la inteligencia artificial”, defendiendo que el gobierno debería tener el poder de detener la implementación de modelos de IA inseguros.

Al igual que Pliny, un investigador de Amazon también detectó el riesgo de “salto de jaula”, pero con un enfoque diferente.

El CEO de Amazon, Andy Jassy, decidió saltarse Anthropic — la compañía en la que Amazon invierte mucho — y envió un informe de “salto de jaula” al gobierno de EE. UU.

Varios medios revelaron que, tras recibir la “carta de denuncia” de Amazon el 12 de junio, Anthropic recibió una ultimátum del gobierno estadounidense, con instrucciones de cerrar el acceso a dos modelos en 90 minutos. Amodei intentó salvar la situación con una llamada, pero finalmente recibió una orden de “control de exportaciones de emergencia”.

Esa noche, Anthropic cumplió con la orden. Curiosamente, Amodei y su equipo reforzaron la medida, desconectando Fable 5 y Mythos 5 en todo el mundo, sin importar si eran estadounidenses o no.

Desde el 9 de junio, cuando se publicó, hasta el 12 de junio, cuando se retiraron de forma urgente, se puede llamar a esto la “crisis de 72 horas” de Anthropic.

Cuando compartí esta noticia en redes sociales, cité una famosa línea de una película hongkonesa: “No se puede hacer, entonces no hagamos nada”.

Aquí hay un espacio para reflexionar: si la orden era desconectar a los “usuarios no estadounidenses”, ¿por qué Anthropic optó por una medida tan radical? Hay que recordar que Anthropic nunca ha sido un “buen niño obediente”: en el primer trimestre, Amodei presentó su “Constitutional AI” (AI constitucional), un conjunto de términos de servicio que, a costa de abandonar contratos con el gobierno de EE. UU., defendía que la IA no debería usarse para fines militares o de vigilancia.

Sobre la decisión de “todo o nada”, algunos analistas opinan que Anthropic carece de tiempo para responder y no pudo filtrar a los usuarios a tiempo, especialmente porque muchos acceden a través de API, incluso con intermediarios API, lo que hace la tarea muy difícil.

Esta explicación tiene sentido, pero si revisamos la política en su sitio web, veremos que Anthropic ya ha tomado medidas en ese sentido. Su política de privacidad más reciente insinúa que pedirá a los usuarios que proporcionen edad, identidad y otros datos, lo que muchos interpretan como posible incorporación de reconocimiento facial en modelos futuros de Claude. Desde esa perspectiva, identificar si un usuario es “estadounidense” o “extranjero” no sería difícil.

La irresistible confianza

“Muchos analistas basan su interpretación legal en el mecanismo de ‘carta informativa’ (informed letter)”, dice un investigador que sigue las políticas de control de exportaciones.

En el sistema de control de exportaciones de EE. UU., la carta informativa es una herramienta administrativa no pública y rápida, utilizada por la Oficina de Seguridad Industrial del Departamento de Comercio (BIS). Permite a las agencias regulatorias, sin modificar la legislación, enviar cartas a las empresas objetivo para exigir permisos de exportación para ciertos artículos, tecnologías, etc.

A finales de 2023, Nvidia lanzó un producto especial para China, H20, para sortear las restricciones en capacidad y ancho de banda de GPU impuestas por las regulaciones de exportación. Poco después, BIS envió cartas informativas a Nvidia, AMD y otras empresas, exigiendo permisos adicionales para exportar ciertos chips A, y actualizó las regulaciones de exportación en ese proceso.

En el caso de Anthropic, antes de recibir la carta informativa que limitaba el acceso a “usuarios no estadounidenses”, el gobierno de EE. UU. ya había dado instrucciones de “retirar en 90 minutos”. Medios como Politico revelaron que hubo varias rondas de diálogo entre ambas partes, con funcionarios como el Secretario del Tesoro, el Secretario de Comercio y asesores de política de IA en la Casa Blanca, pero Anthropic rechazó esas instrucciones.

Al principio, rechazaron retirar los modelos, pero finalmente, en una acción radical, desconectaron todo. Esa diferencia no puede explicarse solo por dificultades técnicas.

La carta informativa suele ser un preludio a la regulación formal de exportaciones, pero algunos expertos creen que en esta ocasión no se actualizará la regulación, sino que simplemente “se detendrá a Anthropic”.

Piensan que, en el escenario de modelos grandes, aún no hay claridad sobre qué exactamente regular: ¿los pesos del modelo, el acceso vía API, los servicios de inferencia, o alguna “capacidad del modelo” más abstracta?

Antes, la regulación se centraba en productos físicos, incluso en tecnología. Pero una vez que se generan los pesos del modelo, estos pueden difundirse en el espacio digital, dificultando un bloqueo absoluto en el plano físico.

Por eso, “detener a Anthropic” parece una hipótesis razonable. Y, tras ello, discutir mejores formas de gobernanza y alineación también sería lógico. Basándose en esa suposición, se puede inferir que Mythos y Fable pronto volverán, y por eso Sacks, el “emperador de la IA”, insiste en que la “prohibición” es solo una restricción temporal.

¿Por qué el gobierno de EE. UU. usaría medidas administrativas para intervenir en el lanzamiento de modelos de vanguardia en una startup de IA?

La “vulnerabilidad” de los modelos.

En marzo, en una charla con Zhou Hongyi, CEO de 360 Group, mencionó la capacidad de Anthropic para “descubrir vulnerabilidades en modelos”. “Anthropic, mediante programación de IA y búsqueda de fallos, ha resuelto muchos problemas que antes parecían imposibles de solucionar en seguridad. Por eso, propuse que prestaran atención a los ‘agentes de IA’ (IA de seguridad)”.

El investigador también enfatizó que Mythos no se trata solo de un chatbot genérico, sino de capacidades específicas para detectar vulnerabilidades, analizar rutas de ataque y realizar ataques activos en redes.

Seguridad sin consenso

Anthropic no solo reforzó la orden de “ejecutar la prohibición”, sino que también emitió una declaración pública.

“Para garantizar el cumplimiento, debemos detener inmediatamente todos los planes de los usuarios”, afirmó Anthropic, añadiendo que fue un malentendido y que los informes de “salto de jaula” del gobierno y terceros solo se refieren a algunas vulnerabilidades menores previamente conocidas, que parecen relativamente simples.

Por ello, en retrospectiva, las declaraciones de Amodei en su blog personal, defendiendo que el gobierno debería tener el poder de detener modelos inseguros, y que Fable 5 es el modelo más seguro, reflejan una confianza absoluta en la seguridad de sus productos.

Pero también dejaron una advertencia: “Ningún proveedor de modelos puede garantizar una protección completa contra saltos de jaula”. Esa afirmación, en contraste con la idea de seguridad absoluta, resulta contradictoria y hasta algo retórica.

Es decir: “Nuestro modelo es el más seguro, y los modelos inseguros deberían ser bloqueados por las autoridades; nuestros fallos son menores y conocidos; hemos hecho todo lo posible para limitar los saltos de jaula, pero nadie puede bloquearlo al 100%”.

Pero, si un modelo que se dice “el más seguro” tiene vulnerabilidades conocidas, ¿no sería arriesgado ponerlo en línea? ¿No sería como ir a la guerra con heridas abiertas? Y si no se puede bloquear totalmente el salto de jaula, ¿por qué llamar a restringir otros modelos?

Los usuarios familiarizados con Anthropic saben que, además de tener modelos y capacidades excelentes, en realidad también son muy agresivos en seguridad y gobernanza, con una especie de misión de “definidores de reglas en la era de la IA”, que constantemente se autoproclaman “seguro”.

El 19 de septiembre de 2023, Anthropic lanzó RSP 1.0 (Política de expansión responsable), que pide que a mayor capacidad del modelo, mayor sea la seguridad. Antes de lanzar modelos más potentes, no se debe hacer. En ese documento se menciona un mecanismo de clasificación de niveles de seguridad (ASL), donde ASL-1 indica riesgos catastróficos sin sentido, ASL-2 muestra señales tempranas de peligro, pero sin riesgos catastróficos, y ASL-3 aumenta significativamente los riesgos de uso abusivo catastrófico.

“Si la escala de IA supera nuestra capacidad de seguir procedimientos de seguridad necesarios, el marco ASL nos pedirá que detengamos temporalmente el entrenamiento de modelos más potentes”, escribió Anthropic.

Una semana antes del lanzamiento de Fable 5, el 4 de junio, Anthropic publicó un artículo titulado “Cuando la IA se autoconstruye”, llamando a “pausar activamente” para evitar riesgos de mejora recursiva de IA.

Y justo después, se lanzó la serie Fable 5.

Si revisamos esa línea temporal, resulta casi cómico: como si un estudiante destacado dijera “nunca estudio para los exámenes”, pero en realidad estuviera haciendo una preparación frenética.

Si realmente hubiera preocupaciones, ¿por qué, después de llamar a la pausa, lanzar su “modelo más potente”? Esa sería una razón. De hecho, la vista previa del modelo Mythos ya había sido presentada 2 meses antes. Si su capacidad ya era tan revolucionaria, ¿por qué no pidieron la pausa en ese momento?

Anthropic parece actuar con una estrategia de seguridad algo radical, pero esas llamadas y acciones parecen más una forma de presionar a la competencia. Mientras claman por regular modelos inseguros y piden detener el entrenamiento de modelos de vanguardia, ellos mismos siguen iterando y avanzando.

Si en 2023 lanzaron RSP 1.0, que era bastante idealista, en 2025 con RSP 2.2 se volvieron más pragmáticos.

El registro de cambios de RSP 2.2 incluye una modificación: “Excluir a insiders sofisticados y a insiders comprometidos por estado de la norma ASL-3”, y “eliminar la promesa de protección contra ataques de destilación (distillation attacks) en ASL-2”.

Revisé esa modificación y significa que, en adelante, las defensas contra ataques internos o de actores estatales ya no serán estándares de seguridad estrictos. En otras palabras, Anthropic ha “bajado” silenciosamente sus estándares de seguridad, dejando de prometer protección contra las amenazas más difíciles y peligrosas.

El 9 de febrero de 2026, el responsable máximo de seguridad de Anthropic, Mrinank Sharma, renunció. En su carta de despedida, escribió: “El mundo está en peligro. Durante mi mandato, vi lo difícil que es que los valores guíen realmente a la organización… La presión para abandonar lo más importante es constante”.

Pocos días después, el 24 de febrero, Anthropic lanzó RSP 3.0, reescribiendo completamente su estrategia de seguridad y eliminando toda referencia a “pausas”.

En esencia, como se mencionó antes, Anthropic nunca ha activado realmente una pausa en el entrenamiento. Esto es similar a la famosa carta pública de marzo de 2023, que pedía “pausar el entrenamiento de modelos por encima de GPT-4 durante 6 meses”. En esa ocasión, Elon Musk fue un participante clave: firmó la carta, anunció xAI y en noviembre lanzó Grok-1.

Por eso, los laboratorios de grandes modelos en realidad no tienen un “consenso de seguridad”: las pausas son más una estrategia comercial.

Impulsados por el capital

Con Fable 5, el precio de entrada y salida es de 10 y 50 dólares por millón de tokens, respectivamente, el doble de Opus 4.8, aunque con un 90% de descuento por cache hit.

Conversando con un investigador del campo, me dijo: “Es útil, pero caro de verdad”. Esto ha generado memes, videos cortos y gifs sobre cómo los modelos grandes cada vez son más caros, reflejando una tendencia: mientras más potente sea el modelo, aunque sea caro, más usuarios lo usarán.

Por eso, en los últimos tiempos, los modelos nacionales han estado acelerando, ofreciendo inferencias más rápidas y mayor TPS (tokens por segundo), además de subir algo los precios.

Volviendo a Anthropic, en mayo de 2021, Amodei y su hermana, junto con 14 investigadores, abandonaron OpenAI y fundaron Anthropic, recibiendo en la ronda A 124 millones de dólares, con una valoración de 550 millones. Cinco años después, en 2025, su financiación en la ronda H alcanzó 6.5 mil millones de dólares, con una valoración de 96.5 mil millones, creciendo más de 1700 veces en ese período.

Pero lo que crece más rápido que la valoración, son los ingresos.

A principios de 2024, los ingresos anuales de Anthropic eran menos de 1,000 millones, pero para finales de 2025 alcanzaron aproximadamente 9,000 millones (medido en ARR). En el primer trimestre de 2026, sus ingresos fueron de 4,8 mil millones, y documentos obtenidos por The Wall Street Journal muestran que, en el segundo trimestre, se espera que lleguen a 10,9 mil millones.

Según datos públicos, el 1 de junio, Anthropic presentó en secreto su solicitud de IPO ante la SEC. La idea es listar antes que OpenAI, en el cuarto trimestre de este año, con una recaudación de 60 mil millones de dólares. Con unos ingresos trimestrales de 10 mil millones, el ARR anual sería superior a 40 mil millones, y con una valoración de 96.5 mil millones, los inversores pagarían unas 24 veces el ARR, lo que requiere un crecimiento exponencial en ingresos para justificar esa valoración.

En ese contexto, cada promesa de seguridad, como “detener el entrenamiento si se sobrepasan capacidades”, equivale a frenar el crecimiento de ingresos. Con una valoración de 24 veces el ARR, cualquier “pausa” puede impactar catastróficamente en la valoración.

Por eso, eliminar la referencia a “pausas” en RSP 3.0 no es casualidad, sino que parece una concesión a la presión del capital. En la fase clave de la IPO, cualquier posible “freno” debe ser eliminado, y esto también se refleja en la conformidad del prospecto.

Si no se eliminara el “compromiso de pausa”, en el prospecto debería incluirse una advertencia del tipo: “Nuestra compañía se compromete a detener el despliegue comercial si el modelo alcanza un umbral de seguridad desconocido”, lo cual sería un riesgo de que los ingresos puedan “desaparecer” sin aviso.

Con una valoración de 96.5 mil millones y la presión de la IPO, Anthropic enfrenta un dilema: ¿priorizar los intereses de los accionistas por encima del interés público?

Al ajustar su estructura, la discusión más acalorada fue sobre PBC — la “empresa de interés público”, que también es la estructura de gobernanza de Anthropic. Según ese esquema, un fondo de interés público (LTBT) puede designar 2-3 directores, pero hasta finales de 2024 solo designaron a un miembro del consejo, y en 2025 solo uno más. Solo cuando la presión de la IPO se acercaba, un ex CEO de Novartis, Vas Narasimhan, se unió al consejo, y los 4 de 7 miembros del consejo son ahora designados por el fondo.

Lo sorprendente es que, entre los directores designados por el fondo, solo uno, Jay Kreps (cofundador y CEO de Confluent, designado en mayo de 2024), anunció su renuncia.

La proporción de votos entre “el fideicomiso” y “la gestión + los inversores” volvió a ser 3-3. Antes de que llegue el próximo director designado por el fondo, si hay desacuerdos claros, se puede crear un “vacío de gobernanza”.

¿Llegará esa “séptima persona” antes de la IPO?

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado