Berita dari CoinWorld melaporkan bahwa optimizer Muon memiliki tingkat kepercayaan diri yang tinggi saat pelatihan, tetapi sering terlalu percaya diri terhadap sampel baru. Makalah berjudul "too sharp, too sure: when calibration follows curvature" menyatakan bahwa tingkat kepercayaan pada data pelatihan tidak konsisten dengan tingkat keberhasilan sebenarnya, dan menunjukkan kepercayaan diri yang berlebihan saat pengujian. Eksperimen CIFAR-10 menunjukkan ECE pengujian: Muon 0.065, AdamW 0.061, SGD 0.081, SAM 0.020; ECE pelatihan mendekati 0, menunjukkan perbedaan generalisasi yang signifikan. Makalah ini mengusulkan Calmo yang dapat menurunkan ECE pengujian Muon menjadi 0.019, namun belum diverifikasi pada model bahasa besar. Laporan DeepSeek V4 menyebutkan bahwa masih ada modul yang menggunakan AdamW, sehingga perlu memperhatikan performa generalisasi Muon.

CoinNetwork

2026-04-27 07:45:55

Pembuatan abstrak sedang berlangsung

Berita dari CoinWorld, optimizer Muon menunjukkan tingkat kepercayaan diri yang sangat tinggi selama pelatihan, tetapi cenderung mengalami fenomena kepercayaan diri berlebihan pada sampel baru. Makalah terbaru berjudul 《too sharp, too sure: when calibration follows curvature》 menunjukkan bahwa model dapat menilai tingkat keyakinannya dengan akurat pada data pelatihan, tetapi pada data pengujian, tingkat kepercayaan tidak sesuai dengan tingkat keberhasilan sebenarnya, yang menyebabkan kepercayaan diri berlebihan. Eksperimen menunjukkan bahwa ECE pengujian Muon pada tugas klasifikasi gambar CIFAR-10 adalah 0,065, AdamW adalah 0,061, SGD adalah 0,081, dan SAM adalah 0,020. ECE pelatihan Muon hampir mendekati 0, menunjukkan adanya perbedaan yang lebih mencolok antara data pelatihan dan data pengujian. Metode Calmo yang diajukan dalam makalah dapat menurunkan ECE pengujian Muon menjadi 0,019, tetapi belum diverifikasi pada model bahasa besar. Laporan teknologi DeepSeek V4 menunjukkan bahwa beberapa modul masih menggunakan AdamW, mengingatkan perlunya perhatian terhadap kinerja Muon saat generalisasi.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
WCTCTradingKingPK
277.24K Popularitas
#
比特币Breaks79K
11.67M Popularitas
#
IsraelStrikesIranBTCPlunges
34.28K Popularitas
#
CryptoMarketsRiseBroadly
86.81K Popularitas
#
WHCADinnerShootingIncident
14.49K Popularitas

Sematkan

peta situs

Kepercayaan diri saat pelatihan Muon sangat akurat, tetapi mudah overfit saat beralih ke sampel baru

Topik Trending

WCTCTradingKingPK

比特币Breaks79K

IsraelStrikesIranBTCPlunges

CryptoMarketsRiseBroadly

WHCADinnerShootingIncident

Sematkan