Claude Opus 4.6 Últimamente parece que realmente ha empeorado en capacidad... La semana pasada, en la prueba de referencia de BridgeBench, todavía se mantenía en segundo lugar con una precisión del 83.3%. Como resultado, el 12 de abril, al volver a probarlo, cayó directamente al décimo lugar, con una precisión del 68.3% y una tasa de alucinaciones que se disparó al 98%. La comparación de antes y después muestra claramente la diferencia. Muchas personas que lo usan últimamente para escribir código y hacer inferencias también sienten que se ha vuelto más torpe, olvidando instrucciones rápidamente y diciendo tonterías con mayor frecuencia.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado