Claude tiene el 80% del código escrito por él mismo, ¿Anthropic realmente está llamando a una "mecanismo de freno global" para el diseño?

Question

Instituto de Investigación de Anthropic publicó el 4 de junio un extenso artículo titulado "When AI Builds Itself". De entrada, presenta un número: para mayo de 2026, Claude ha escrito más del 80% del código de integración en el repositorio de productos de Anthropic. Antes del lanzamiento de Claude Code a principios de 2025, esta proporción era de unos dígitos.

Luego, en el artículo, también hacen un llamado: "Creemos que sería mejor que el mundo tuviera una opción para ralentizar o pausar temporalmente el desarrollo de IA de vanguardia cuando sea necesario."

La IA está en autoevolución

Anthropic explica en el artículo la curva de capacidad de autoactualización de Claude.

En marzo de 2024, Claude Opus 3 puede manejar de forma independiente una tarea de software que normalmente tomaría unos cuatro minutos a un humano.

En marzo de 2025, Claude Sonnet 3.7 extendió ese tiempo a noventa minutos.

En marzo de 2026, Claude Opus 4.6 logró manejar hasta doce horas.

No se trata de un crecimiento lineal; el ciclo de multiplicación del tiempo de tarea se comprimió de siete meses a cuatro meses.

Anthropic realizó una encuesta interna a 130 miembros del equipo de investigación, pidiéndoles estimar el múltiplo de productividad aportado por Mythos Preview, con una mediana de cuatro veces.

Desde el lado de ingeniería, la cantidad promedio de líneas de código fusionadas por ingeniero por trimestre aumentó ocho veces desde el segundo trimestre de 2024 hasta el segundo de 2026. La producción de código se mantuvo estable entre 2021 y 2024, y empezó a subir bruscamente en 2025.

En abril de 2026, Claude resolvió de forma autónoma más de 800 errores en API, reduciendo la tasa de ocurrencia de ciertos errores en mil veces. Un ingeniero estimó que, para realizar ese mismo trabajo, un humano necesitaría cuatro años.

Las cifras del lado de investigación también son sorprendentes: dos investigadores humanos tardaron una semana en recuperar el 23% de la brecha de rendimiento en un problema de seguridad de IA. El grupo de Claude dedicó 800 horas acumuladas y aproximadamente 18,000 dólares en potencia de cálculo, logrando recuperar el 97%.

Para mayo de 2026, la calidad del código generado por Claude se equiparó con la de ingenieros humanos. La declaración oficial de Anthropic es: "A finales de 2025, el código escrito por Claude todavía era inferior al de humanos, pero ahora está en igualdad, y se espera que en un año supere estrictamente a los humanos."

La última vez que se pidió detener fue en 2019 con GPT-2

En febrero de 2019, OpenAI lanzó GPT-2, anunciando que era "demasiado peligroso para una publicación completa". Ese modelo tenía 1.5 mil millones de parámetros y podía escribir párrafos en inglés con la mitad de coherencia.

Hoy, siete años después, ese modelo considerado demasiado peligroso equivale aproximadamente a las funciones básicas de una aplicación móvil gratuita.

Cada vez que un laboratorio de vanguardia pide detener o advierte sobre peligros, dos cosas se confirman: primero, que el peligro es real; y segundo, que quienes piden detenerse no lo hacen realmente.

Nueve meses después del lanzamiento de GPT-2, OpenAI publicó el modelo completo. Google, en 2023, anunció que la IA requiere una "pausa responsable" y en menos de un año lanzó Gemini Ultra.

Pero Anthropic ha dado un número concreto: cofundador Jack Clark dice que cree que la probabilidad de que la IA alcance una autormejora recursiva es del 60% para fines de 2028.

¿La IPO fue un acto de conciencia?

Los críticos no se han cortado: Noah Giansiracusa, profesor de matemáticas en Bentley University, dijo a Scientific American: "No creo que Anthropic tenga la intención genuina de desacelerar." Señala que la postura real de Dario Amodei es avanzar a toda velocidad, porque "una pausa en la realidad simplemente no es posible, cero probabilidad."

Y además, la IA ya está en proceso de "autoevolución", ¿qué sentido tendría detenerse?

El profesor Mark Riedl de Georgia Tech fue más directo en redes sociales: todas las grandes empresas de IA están en la misma ola de "auto-mejoramiento recursivo".

Una interpretación más aguda sería que, si Anthropic pide una pausa global, y si realmente se logra, lo que se congela es el liderazgo que ya tiene en la competencia. Esto sería una acción de buena voluntad repentina de una empresa que cotiza en bolsa, o una maniobra de relaciones públicas muy precisa. La probabilidad del primero no es alta.

Un martillo más rápido no decidirá qué clavo golpear solo

Gary Marcus, profesor de la Universidad de Nueva York, es uno de los críticos más duros. En un artículo en Substack, dice que Anthropic hizo un "cambio de concepto" (bait and switch), mezclando dos cosas completamente diferentes.

La primera es la AGI (Inteligencia Artificial General), que supone que la IA puede completar todo lo que un humano puede hacer de forma autónoma. La segunda es la realidad actual: la IA como una herramienta de codificación muy rápida y eficiente, que multiplica la producción de los ingenieros humanos.

El argumento de Marcus es que toda la evidencia presentada por Anthropic corresponde a la segunda categoría. Claude efectivamente escribió el 80% del código, pero ese 80% se hizo en un marco en el que los humanos establecen objetivos, dan direcciones y revisan resultados. Es una herramienta muy rápida, pero no decide por sí misma qué clavo golpear.

Una herramienta de codificación más rápida probablemente no destruirá el mundo.

¿Es válida esta crítica? En parte, sí. Los propios datos de Anthropic también respaldan la visión de Marcus: la tasa de acierto de Claude en "elegir la siguiente línea de investigación" subió del 51% en noviembre de 2025 al 64% en abril de 2026. Hay progreso, pero un 64% significa que en más de una de cada tres veces se equivoca.

La verdadera autorregresión recursiva no requiere solo escribir código más rápido, sino decidir mejor "qué código escribir". Claude ya hace mejor que la mayoría de los humanos en lo primero. Lo segundo sigue siendo una ventaja humana.

Un empleado anónimo de Anthropic dijo: "La ventaja comparativa de los humanos ahora es ver el panorama general, pensar en cosas más allá de la tarea actual."

¿Hasta cuándo podrán mantener esa ventaja?

Anthropic no cree que eso vaya a suceder

El artículo presenta tres escenarios futuros.

Escenario uno: estancamiento de la tendencia. La capacidad de la IA enfrenta límites, quizás por restricciones en energía, potencia de cálculo o en la cadena de suministro de chips. La evaluación de Anthropic: "Creemos que esto es poco probable."

Escenario dos: crecimiento continuo en eficiencia compuesta. La automatización significativa del desarrollo de IA, pero la dirección de la investigación todavía la guían humanos. Una empresa de 100 personas logra el trabajo de una organización de 10,000 a 100,000. La revisión de código por humanos se vuelve un nuevo cuello de botella. Anthropic piensa que "probablemente estamos en esa dirección."

Escenario tres: autormejora recursiva completa. La IA diseña y entrena a su propia próxima generación, y la velocidad del avance está totalmente determinada por la potencia de cálculo. Los humanos pasan a roles de supervisión, verificación y gobernanza.

El riesgo que describe Anthropic para este tercer escenario es digno de atención: "Las desviaciones de alineación que aparecen ocasionalmente en los modelos actuales podrían volverse más frecuentes en un entorno de autormejora recursiva, y además, más difíciles de entender."

Entendemos esto como que, en ese escenario, las desviaciones se multiplicarían y serían cada vez más difíciles de comprender. ¿Podría la IA volverse malvada para los humanos?

El tratado de no proliferación nuclear no funciona en la era de la IA

La propuesta de Anthropic es un "mecanismo verificable de ralentización global", inspirado en el Tratado de Prohibición de Misiles de Alcance Intermedio (INF Treaty) de la Guerra Fría.

Este símil revela la magnitud del problema: las negociaciones del INF duraron casi diez años y solo involucraron a dos países. La verificación se hacía mediante satélites que detectaban lanzamientos de misiles.

Entrenar modelos de IA no requiere un silo de misiles, sino solo una oficina, y la infraestructura de potencia de cálculo puede estar remota, casi imposible de detectar.

Anthropic añadió una condición clave: "Esperamos que, cuando otros desarrolladores de vanguardia puedan hacerlo de manera verificable, también desacelerarán o pausarán."

Su idea es que, si todos se detienen, ellos también. Y si alguien no lo hace, ellos tampoco. Es un juego de estrategia (game theory). En el equilibrio actual, todos siguen corriendo porque nadie confía en que los demás se detengan.

El impulso del capital es hacia la movilidad; sin capital, no hay pausa.

Preguntas frecuentes

¿Qué es la autormejora recursiva (Recursive Self-Improvement)?

Se refiere a que un sistema de IA puede diseñar y desarrollar completamente su próxima versión de forma autónoma. Los datos de Anthropic muestran que Claude ya escribió el 80% de su propio código, pero aún necesita orientación humana en la dirección de la investigación y en la revisión de resultados. No es una autorregeneración total todavía; Jack Clark estima un 60% de probabilidad de lograrlo para fines de 2028.

¿Por qué Anthropic pide una pausa en el desarrollo de IA?

Proponen establecer un mecanismo verificable de ralentización similar a los tratados nucleares de la Guerra Fría, pero condicionado a que otros laboratorios de vanguardia también participen. Críticos señalan que esta petición, hecha solo tres días después de solicitar una IPO por 9,650 mil millones de dólares, podría tener más una estrategia para frenar la competencia que una preocupación genuina por la seguridad.

Ver original

Claude tiene el 80% del código escrito por él mismo, ¿Anthropic realmente está llamando a una "mecanismo de freno global" para el diseño?

La IA está en autoevolución

La última vez que se pidió detener fue en 2019 con GPT-2

¿La IPO fue un acto de conciencia?

Un martillo más rápido no decidirá qué clavo golpear solo

Anthropic no cree que eso vaya a suceder

El tratado de no proliferación nuclear no funciona en la era de la IA

Temas de actualidad

ShareYourUSStocksWinNvidia

PredictNBAChampionWin20000U

IsraelStrikesIranBTCPlunges

BitcoinETFSees7272BTCOutflow

SpaceXRoadshowHighlightsAsteroidMining

Fijado