Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
Percepatan pra-pelatihan 2 hingga 3 kali lipat, solusi baru Nous TST terjebak dalam kontroversi "tabrakan"
ME News Berita, 14 Mei (UTC+8), menurut pemantauan Beating dari Dongcha, Nous Research merilis skema pelatihan pra-pelatihan model besar baru yang disebut pelatihan bertumpuk token (TST). Skema ini dengan mengemas dan mengompresi token bertetangga di awal pelatihan, dapat mempercepat waktu pra-pelatihan sebanyak 2 hingga 3 kali lipat dengan jumlah perhitungan yang sama. TST terdiri dari dua tahap. Dalam 20% hingga 40% awal pelatihan, model tidak lagi membaca token satu per satu, melainkan mengemas token bertetangga dan menghitung rata-ratanya sebagai input, dan di bagian output memprediksi token apa saja yang termasuk dalam paket berikutnya (tanpa memperhitungkan urutan internal). Setelah itu, model kembali ke prediksi token berikutnya secara konvensional. Karena arsitektur dasar tidak diubah, model yang dihasilkan saat inferensi sama persis dengan model standar. Metode ini telah terbukti pada model MoE dengan 100 miliar parameter tertinggi. Esensi dari skema ini adalah “menggunakan data untuk mengubah kekuatan komputasi”, dengan mempercepat konsumsi korpus untuk mengurangi waktu komputasi. Jika di masa depan teks berkualitas tinggi habis, karakter akselerasi ini dalam mengonsumsi data mungkin menjadi kelemahan. Selain itu, beberapa jam setelah publikasi makalah, seorang pembaca menunjukkan bahwa mekanisme TST sangat mirip dengan karya lama yang dirilis pada 2024 berjudul “Beyond Next Token Prediction”. Tim penulis kemudian mengakui di Hugging Face bahwa ini adalah “penelitian konvergen yang tidak diinginkan (convergent research)”, dan berjanji akan memperbarui makalah dengan kutipan tambahan. (Sumber: BlockBeats)