2026-04-13 15:52:30

Claude Opus 4.6 Últimamente parece que realmente ha empeorado en capacidad... La semana pasada, en la prueba de referencia de BridgeBench, todavía se mantenía en segundo lugar con una precisión del 83.3%. Como resultado, el 12 de abril, al volver a probarlo, cayó directamente al décimo lugar, con una precisión del 68.3% y una tasa de alucinaciones que se disparó al 98%. La comparación de antes y después muestra claramente la diferencia. Muchas personas que lo usan últimamente para escribir código y hacer inferencias también sienten que se ha vuelto más torpe, olvidando instrucciones rápidamente y diciendo tonterías con mayor frecuencia.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
GateFounderDrHan13thAnniversaryLetter
35.85K Popularidad
#
CryptoMarketsDipSlightly
168.34K Popularidad
#
IsraelStrikesIranBTCPlunges
29.19K Popularidad
#
USBlocksStraitofHormuz
708.21K Popularidad
#
AaveDAOApproves$25MGrant
1.8M Popularidad

Anclado

Temas de actualidad

GateFounderDrHan13thAnniversaryLetter

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

USBlocksStraitofHormuz

AaveDAOApproves$25MGrant

Anclado