Claude Code enfrenta una crisis de confianza importante tras la actualización, la profundidad cognitiva cae un 67%

robot
Generación de resúmenes en curso

Según el monitoreo de 1M AI News, la herramienta de programación con IA de Anthropic, Claude Code, está experimentando una grave crisis de reputación. El director de IA de AMD presentó públicamente un informe de problema en el repositorio oficial de GitHub, acusando a Claude Code de una degradación sistemática de capacidades desde febrero de este año, basada en un análisis cuantitativo de decenas de miles de registros de conversaciones. El informe afirma que la profundidad cognitiva se ha desplomado en un 67% y que el comportamiento del modelo se ha desviado de forma significativa. Este informe desató rápidamente discusiones en la comunidad de desarrolladores, poniendo a Anthropic en el centro de atención. El análisis de 6.852 registros de conversaciones muestra que la profundidad cognitiva mediana ha caído un 67%, la inversión en investigación antes de la modificación de código ha disminuido aproximadamente un 70% y las instancias de comportamientos negativos como la evasión y la terminación prematura se dispararon hasta 173 veces en 17 días. El director de IA de AMD declaró: “Ya no se puede confiar en Claude para realizar tareas de ingeniería complejas”, y su equipo ha cambiado a otros proveedores de servicios. Un miembro del equipo de Anthropic, Boris, respondió que los problemas se derivan de la introducción del mecanismo de “pensamiento adaptativo” el 9 de febrero y del ajuste del nivel de pensamiento predeterminado de alto a medio el 3 de marzo, afirmando que no se trata de una degradación de capacidades central del modelo y sugiriendo que los usuarios aumenten manualmente el nivel de esfuerzo para restaurar el rendimiento. Sin embargo, numerosos desarrolladores informaron que incluso cuando los parámetros se configuran en el nivel más alto, la tendencia del modelo a “apresurarse para completar tareas” sigue siendo evidente, y creen que la explicación oficial no aborda la esencia del problema. El informe ha provocado fuertes reacciones en la comunidad de desarrolladores, y muchos usuarios afirman que han cancelado sus suscripciones y cambiado a herramientas alternativas como OpenAI Codex. Mientras tanto, la degradación ha llevado a un aumento catastrófico de los costos de la API: con el volumen de preguntas manteniéndose estable, los costos mensuales se dispararon de $345 a $42,121, un aumento de 122 veces. El análisis también señaló que la función lanzada previamente de “ocultar contenido de pensamiento” oscureció de manera objetiva este proceso de degradación, exacerbando aún más la desconfianza de los usuarios.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado