Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
Huawei dan Universitas Sains dan Teknologi China bekerja sama mengatasi monopoli Nvidia, mempercepat perhitungan model besar pada Ascend A3 sebesar 58%
Menurut pemantauan Beating, dalam evolusi arsitektur MoE skala besar, memanfaatkan chip domestik Ascend untuk melatih model besar telah menjadi arah kunci dalam membangun kekuatan AI yang mandiri dan dapat dikendalikan. Namun, sebagian besar kerangka model besar utama dikembangkan berdasarkan ekosistem CUDA dari Nvidia, sehingga saat dipindahkan langsung ke platform Ascend, sering menghadapi tantangan seperti penjadwalan antrean perangkat keras yang tidak merata dan rendahnya pemanfaatan daya komputasi. Universitas Tiongkok, Huawei, dan Peking University secara bersama-sama meluncurkan kerangka penjadwalan kompilasi HyperParallel-MoE, yang menyesuaikan dengan antrean perangkat keras unik dari Ascend A3 melalui pengaturan tingkat ubin (tile-level), bertujuan untuk mengatasi hambatan efisiensi energi dalam penjadwalan heterogen daya komputasi secara paralel.
Ascend A3 memiliki dua jenis inti, AIC bertanggung jawab atas perkalian matriks, sedangkan AIV menangani komputasi vektor dan komunikasi. Namun, dalam penjadwalan operator secara serial tradisional, kedua jenis inti ini hanya dapat bekerja secara bergantian dan bergiliran tidak aktif. Data pengujian menunjukkan bahwa saat menjalankan model besar bergaya DeepSeek dengan 671 miliar parameter di cluster 256 node, tingkat pemanfaatan AIC hanya 67%, dan 39% dari latensi komunikasi rute pakar terpapar pada jalur komputasi kritis.
Tiga perubahan utama pada inti HyperParallel-MoE. Pertama, merancang primal penulisan satu sisi yang didorong oleh AIV, sehingga data ubin yang tiba langsung memicu komputasi tanpa menunggu seluruh batch lengkap. Kedua, memperkenalkan pembuatan tugas ubin yang bergantung pada kesadaran, mengabstraksi komunikasi dan operator komputasi secara bersamaan. Ketiga, menggunakan penjadwal statis untuk menghasilkan urutan tugas sebelumnya, menggerakkan kedua jenis inti secara paralel dalam satu kernel, dan memanfaatkan cache L2 berkecepatan tinggi untuk berbagi hasil sementara, mengurangi latensi penulisan kembali dan pembacaan dari memori lambat HBM.
Pengujian menunjukkan bahwa di bawah routing seimbang 64 node, modul inti yang bertanggung jawab atas komputasi pakar (MoE-FFN) mengurangi latensi sekitar 36%, yang setara dengan peningkatan kecepatan pemrosesan data hingga 58% (yaitu peningkatan dari 1,49 menjadi 1,58 kali). Dalam operasi end-to-end seluruh sistem, kecepatan pelatihan per langkah juga meningkat secara bersamaan sebesar 8% hingga 9%. Ini menunjukkan bahwa efisiensi energi nyata Ascend tidak hanya bergantung pada spesifikasi perangkat keras, tetapi juga pada seberapa efisien compiler dan runtime dapat menjadwalkan inti AIC/AIV secara optimal.