Solo saber Vibe Coding no te convierte en experto! Anthropic revela la verdad: el conocimiento especializado es más importante que escribir código

El informe señala que, al usar inteligencia artificial para programar, el conocimiento del dominio y la capacidad de aceptación son más importantes que las habilidades de programación. Contar con juicio profesional y capacidad para formular preguntas puede aumentar significativamente la tasa de éxito de las tareas.

El 16 de junio, Anthropic publicó un informe de investigación titulado «Programación agentica y retornos persistentes hacia la experiencia» (agentic coding se refiere a "programación por encargo", tú das instrucciones, la IA lee archivos y ejecuta comandos para completar la tarea).

El informe analiza aproximadamente 235,000 usuarios y unas 400,000 interacciones con Claude Code entre octubre de 2025 y abril de 2026, y busca responder a una pregunta que preocupa a muchos: ¿las personas sin entrenamiento formal en programación realmente pueden dirigir a la IA para realizar trabajos técnicos complejos?

La respuesta del informe es afirmativa, pero lo que realmente merece atención es la conclusión: quizás no sea tan importante saber programar, sino entender profundamente «la tarea que tienes en mano».

"Todos pueden programar", esa frase solo es parcialmente cierta

En el último año, el "vibe coding" (programar por intuición, describiendo en lenguaje natural lo que quieres, y la IA genera código ejecutable sin que tengas que entender cada línea) se ha popularizado en la comunidad de desarrolladores. Siguiendo esta tendencia, la narrativa más común es: la barrera para programar se ha nivelado, todos son ingenieros.

¿Para quién favorece esta narrativa? Para los fabricantes de herramientas de IA, y para los jefes que ya no necesitan contratar ingenieros, son buenas historias. Pero el informe corrige esa visión con una versión más pragmática.

Anthropic evalúa a cada usuario en cada interacción, calificando su nivel desde "principiante" hasta "experto" en una escala de cinco niveles, basada en la transcripción completa. Es importante notar que este nivel de competencia no está relacionado con el cargo o la inteligencia, sino que es específico para cada tarea.

El informe presenta un ejemplo clave: un contador que nunca ha usado Python, si puede comunicar claramente las reglas de conciliación con Claude y detectar errores en los límites en el cierre mensual, en esa tarea es un experto; en cambio, un ingeniero senior que pregunta por primera vez sobre Rust, es un novato.

En otras palabras, la "especialización" aquí no es saber programar, sino entender cuánto sabes sobre «el problema en sí». Por eso, reducir la narrativa a "todos pueden reemplazar a los ingenieros" es un error, porque el conocimiento del dominio es una forma de juicio profesional que requiere años de experiencia; no ha desaparecido, solo se ha desplazado a una posición que ahora puede convertirse en un cuello de botella.

¿Cómo se divide el trabajo? Tú planteas la pregunta, la IA responde

La gráfica más clara del informe muestra la división de decisiones entre humanos y IA. Anthropic divide cada decisión en "planificación" (qué hacer, qué método usar, cómo saber que está terminado) y "ejecución" (qué archivos modificar, qué código escribir, en qué lenguaje). El resultado es que, en promedio, los humanos toman aproximadamente el 70% de las decisiones de planificación, mientras que Claude realiza alrededor del 80% de las decisiones de ejecución.

Fuente: Anthropic

En términos simples, los humanos se encargan de formular las preguntas y verificar los resultados, mientras que la IA realiza las tareas. Además, cuanto más experto sea el usuario, más tiende a "soltar" esa división: el informe revela que los principiantes, en promedio, generan unas 5 acciones por cada instrucción y producen unos 600 caracteres; los expertos, en cambio, generan unas 12 acciones y unos 3,200 caracteres. Los usuarios con más experiencia se atreven a delegar bloques mayores de trabajo porque saben cómo describir y cómo verificar.

Fuente: Anthropic

Este es el primer hallazgo contraintuitivo del informe: cuanto más poderosa sea la IA, el apalancamiento del usuario experto no se reduce, sino que se amplifica.

La verdadera diferencia en los números está en la tasa de éxito

Anthropic mide el éxito de la interacción de dos maneras: la más flexible es "al menos parcialmente exitoso"; la más estricta se llama "éxito verificado" (que significa que no solo la IA considera que la tarea está completa, sino que hay evidencia tangible como commits en git, pruebas pasadas, o confirmación explícita del usuario).

Según el estándar más estricto, la tasa de éxito verificado en conversaciones con principiantes es solo del 15%, mientras que en niveles intermedios y expertos sube a entre 28% y 33%. Bajo un estándar más flexible, los principiantes alcanzan un 77%, y los intermedios y superiores un 91% a 92%.

Fuente: Anthropic

Pero hay un detalle que el informe enfatiza: la mayor parte de la mejora se concentra en pasar de "principiante" a "intermedio", y la curva se aplana al llegar a nivel experto. En palabras del informe, con un conocimiento básico en un área, ya se puede obtener la mayor parte de los beneficios; la profundidad solo aporta un pequeño extra.

La diferencia también se refleja en quién aguanta más cuando la conversación se complica (errores, fallos en pruebas, repeticiones): el 19% de los principiantes abandona sin escribir ni una línea de código, mientras que solo el 5-7% de los demás lo hace. La interpretación del informe es que la capacidad de volver a encarrilar a la IA forma parte del juicio profesional.

Un hallazgo subestimado: la diferencia profesional no es tan grande como parece

Si la experiencia en programación fuera realmente tan decisiva, los ingenieros deberían liderar ampliamente. Pero los datos no muestran eso.

En conversaciones que generan código, la tasa de éxito verificado de los profesionales en tecnología es aproximadamente del 34%, y la de otros profesionales solo un 29%, una diferencia de solo 5 puntos porcentuales, y en siete meses esa brecha no se amplió ni se redujo.

El informe analiza las diez profesiones principales en los datos, y cada una tiene una tasa de éxito dentro de 7 puntos porcentuales de la de los ingenieros. Sorprendentemente, los gerentes tienen una tasa de éxito verificado incluso ligeramente superior a la de los ingenieros.

El informe ofrece dos posibles explicaciones: una, que las habilidades de "dirigir, encargar, definir tareas" de los gerentes se transfieren bien a la dirección de IA; y otra, que la medición puede estar sesgada, ya que el éxito verificado depende en parte de que el usuario diga claramente en la conversación "sí, así es", y los gerentes están más acostumbrados a expresarse con claridad.

En estos siete meses también hay cambios interesantes: la proporción de conversaciones dedicadas a debug (depuración, arreglar errores) cayó del 33% al 19%, casi a la mitad; en cambio, las tareas de operación de software (despliegue, configuración, poner en marcha el software) subieron del 14% al 21%, y la escritura y análisis de datos casi se duplicaron, pasando del 10% al 20%.

El informe estima, usando una comparación con el mercado de trabajo freelance (aclarando que solo es una referencia relativa, no un valor exacto), que el valor promedio de cada tarea aumentó aproximadamente un 27% en ese período (el resumen del informe menciona un 25%).

Lo que el informe no dice, pero vale la pena pensar

El informe reconoce sus limitaciones: no puede medir los resultados en el mundo real, no sabe si el código generado en una interacción se usa realmente después, y excluye usos "no interactivos" (como integrar Claude Code en procesos automáticos), que representan una parte importante. Todo análisis se basa en la interpretación de la transcripción, por lo que es una "instantánea temprana", no una conclusión definitiva.

Lo que más debería preocupar a quienes trabajan en conocimiento es la pregunta que el informe deja al final. Anthropic dice que seguirá monitoreando: si en algún momento la "recompensa del conocimiento del dominio" empieza a disminuir, será señal de que los modelos comienzan a proveer ese juicio por sí mismos, sin que el usuario tenga que aportarlo.

La enseñanza principal del informe es que no necesitas angustiarte por no saber programar, sino que es más rentable profundizar en tu área de expertise y definir claramente qué significa "hacer bien" en ella.

Primero, entiende bien el problema, y luego deja que la IA acelere la solución; primero verifica, y después suelta.

  • Este artículo es una reproducción autorizada de: 《數位時代》
  • Título original: 《No basta con saber programar! Anthropic revela la verdad del Vibe coding: más que programar, el "conocimiento del campo" es la mayor palanca》
  • Autor original: 李先泰
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado