O site CoinWorld reporta que o otimizador Muon apresenta alta confiança durante o treino, mas frequentemente é excessivamente confiante em novas amostras. O artigo "too sharp, too sure: when calibration follows curvature" afirma que a confiança no conjunto de treino não corresponde à taxa de acerto real, levando a uma confiança excessiva durante os testes. Experimentos com CIFAR-10 mostram que o ECE de teste é: Muon 0,065, AdamW 0,061, SGD 0,081, SAM 0,020; o ECE de treino próximo de 0 indica uma diferença de generalização significativa. O artigo propõe o Calmo, que pode reduzir o ECE de teste do Muon para 0,019, ainda não validado em grandes modelos de linguagem. O relatório DeepSeek V4 afirma que alguns módulos ainda usam AdamW, sendo necessário monitorar o desempenho de generalização do Muon.

CoinNetwork

2026-04-27 07:45:55

Geração de resumo em curso

Notícias do site Coinjie, o otimizador Muon demonstra alta confiança durante o treinamento, mas tende a apresentar excesso de confiança em novas amostras. O mais recente artigo 《too sharp, too sure: when calibration follows curvature》 aponta que o modelo consegue avaliar com precisão seu nível de confiança no conjunto de treinamento, mas no conjunto de teste, a confiança não corresponde à taxa de acerto real, levando ao excesso de confiança. Experimentos mostram que, na tarefa de classificação de imagens CIFAR-10, o ECE de teste do Muon é 0,065, o do AdamW é 0,061, o do SGD é 0,081, e o do SAM é 0,020. O ECE de treinamento do Muon é quase zero, indicando uma diferença mais acentuada entre o conjunto de treinamento e o de teste. O método Calmo, proposto no artigo, consegue reduzir o ECE de teste do Muon para 0,019, mas ainda não foi validado em grandes modelos de linguagem. O relatório técnico DeepSeek V4 mostra que alguns módulos ainda utilizam AdamW, alertando para a necessidade de monitorar o desempenho do Muon na generalização.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
WCTCTradingKingPK
285.32K Popularidade
#
比特币Breaks79K
11.68M Popularidade
#
IsraelStrikesIranBTCPlunges
34.43K Popularidade
#
CryptoMarketsRiseBroadly
92.06K Popularidade
#
WHCADinnerShootingIncident
16.49K Popularidade

Fixar

A confiança durante o treino do Muon é muito precisa, mas ao mudar para uma nova amostra, é fácil exagerar

Tópicos em destaque

WCTCTradingKingPK

比特币Breaks79K

IsraelStrikesIranBTCPlunges

CryptoMarketsRiseBroadly

WHCADinnerShootingIncident

Fixar