OpenAI introdujo GDPval, un estándar que evalúa el rendimiento de los modelos de IA en tareas económicamente valiosas del mundo real, abarcando 1,320 tareas en 44 ocupaciones de los 9 principales sectores que contribuyen al PIB de EE.UU.
Claude Opus 4.1 fue el modelo con mejor rendimiento donde el 47.6% de los entregables
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
17 me gusta
Recompensa
17
6
Republicar
Compartir
Comentar
0/400
AlphaWhisperer
· hace19h
Es otra competencia de datos, estoy cansado de jugar.
Ver originalesResponder0
FloorSweeper
· hace19h
débil alfa... ni siquiera cerca de lo que se viene fr
Ver originalesResponder0
SleepyArbCat
· hace20h
Ja, no es mejor que la tasa de rendimiento de MEV de una noche.
Ver originalesResponder0
MultiSigFailMaster
· hace20h
No aprobar ni la mitad, las redes neuronales son muy inútiles.
OpenAI introdujo GDPval, un estándar que evalúa el rendimiento de los modelos de IA en tareas económicamente valiosas del mundo real, abarcando 1,320 tareas en 44 ocupaciones de los 9 principales sectores que contribuyen al PIB de EE.UU.
Claude Opus 4.1 fue el modelo con mejor rendimiento donde el 47.6% de los entregables