La red de noticias de la comunidad de criptomonedas informa que el optimizador Muon tiene una alta confianza durante el entrenamiento, pero a menudo es excesivamente confiado en nuevas muestras. El artículo titulado "demasiado afilado, demasiado seguro: cuando la calibración sigue la curvatura" afirma que la confianza en el conjunto de entrenamiento no coincide con la tasa de aciertos real, y que durante la prueba aparece una sobreconfianza. Los experimentos con CIFAR-10 muestran que el ECE de prueba: Muon 0.065, AdamW 0.061, SGD 0.081, SAM 0.020; el ECE de entrenamiento se acerca a 0, lo que indica una diferencia de generalización significativa. El artículo propone que Calmo puede reducir el ECE de prueba de Muon a 0.019, aunque aún no ha sido validado en grandes modelos de lenguaje. El informe de DeepSeek V4 indica que todavía hay módulos que usan AdamW, por lo que se debe prestar atención al rendimiento de generalización de Muon.

CoinNetwork

2026-04-27 07:45:55

Generación de resúmenes en curso

La noticia de CoinWorld informa que el optimizador Muon muestra una alta confianza durante el entrenamiento, pero tiende a ser excesivamente confiado en nuevas muestras. El último artículo titulado «demasiado afilado, demasiado seguro: cuando la calibración sigue la curvatura» señala que el modelo puede juzgar con precisión su nivel de confianza en el conjunto de entrenamiento, pero en el conjunto de prueba, la confianza no coincide con la tasa de aciertos real, lo que conduce a una sobreconfianza. Los experimentos muestran que, en la tarea de clasificación de imágenes CIFAR-10, el ECE de prueba de Muon es 0.065, AdamW es 0.061, SGD es 0.081 y SAM es 0.020. El ECE de entrenamiento de Muon es casi 0, lo que indica una diferencia más marcada entre el conjunto de entrenamiento y el de prueba. El método Calmo propuesto en el artículo puede reducir el ECE de prueba de Muon a 0.019, pero aún no ha sido validado en grandes modelos de lenguaje. El informe técnico de DeepSeek V4 muestra que algunos módulos todavía usan AdamW, recordando la necesidad de prestar atención al rendimiento de Muon en la generalización.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
WCTCTradingKingPK
292.66K Popularidad
#
比特币Breaks79K
11.69M Popularidad
#
IsraelStrikesIranBTCPlunges
34.6K Popularidad
#
CryptoMarketsRiseBroadly
96.96K Popularidad
#
WHCADinnerShootingIncident
19.96K Popularidad

Anclado

La confianza en Muon es muy precisa durante el entrenamiento, pero con muestras nuevas tiende a sobreajustarse.

Temas de actualidad

WCTCTradingKingPK

比特币Breaks79K

IsraelStrikesIranBTCPlunges

CryptoMarketsRiseBroadly

WHCADinnerShootingIncident

Anclado