Bayar dengan

USD

Mendukung Visa, Mastercard, SEPA, dll.

Perdagangan fleksibel, nol biaya

Gunakan kripto untuk pembayaran global

Dasar

Perdagangkan kripto dengan bebas

Perdagangan Margin

Perbesar keuntungan Anda dengan leverage

Konversi & Investasi Otomatis

Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage

Dapatkan eksposur ke posisi leverage dengan mudah

Perdagangan Pre-Market

Perdagangkan token baru sebelum listing

Lanjutan

Lakukan perdagangan on-chain dengan Gate Wallet

Akses cerdas ke token on-chain baru

Strategi cerdas perdagangan otomatis

Ikuti strategi perdagangan expert

Perdagangan CrossEx

Satu saldo margin, digunakan lintas platform

Akses ribuan kontrak perpetual

Satu platform aset tradisional global

Perdagangkan Opsi Vanilla ala Eropa

Memaksimalkan efisiensi modal Anda

Perdagangan Demo

Pengantar tentang Perdagangan Futures

Bersiap untuk perdagangan futures Anda

Gabung acara & dapatkan hadiah

Perdagangan Demo

Gunakan dana virtual untuk merasakan perdagangan bebas risiko

Derivatif CFD Saham AS

Akses saham AS dan ETF yang nyata

Perdagangkan saham berkualitas yang terdaftar di Hong Kong

Perdagangkan Saham Korea Nyata dan Berinvestasi pada Aset Populer

Leverage tinggi, perdagangan 24/7

Tokenized Stocks

Didukung oleh aset saham nyata

Buka akses penuh ke IPO saham global

Mint GUSD untuk Imbal Hasil Treasury RWA

Aktivitas Saham

Perdagangkan Saham Populer dan Dapatkan Airdrop yang Melimpah

Peluncuran

Koleksi permen untuk mendapatkan airdrop

Staking cepat, dapatkan token baru yang potensial

Pegang GT dan dapatkan airdrop besar secara gratis

Buka akses penuh ke IPO saham global

Perdagangkan aset on-chain, raih airdrop

Dapatkan poin futures dan klaim hadiah airdrop

Investasi

Dapatkan bunga dengan token yang menganggur

Investasi Otomatis

Investasi otomatis secara teratur

Investasi Ganda

Keuntungan dari volatilitas pasar

Dapatkan hadiah dengan staking fleksibel

Pinjaman Kripto

Menjaminkan satu kripto untuk meminjam kripto lainnya

Pusat Peminjaman

Hub Peminjaman Terpadu

Pusat Kekayaan VIP

Rencana pertumbuhan kekayaan premium

Manajemen Kekayaan Pribadi

Alokasi aset premium

Strategi quant tingkat atas

Stake kripto untuk mendapatkan penghasilan dalam produk PoS

Leverage tanpa likuidasi

Stake 1 klik, hasil harian

Temukan nilai dalam kripto

Analisis live pasar kripto

Mengobrol dengan trader kripto

Apa yang terjadi di kripto

Lainnya

Promosi

Pusat Aktivitas

Ikuti aktivitas & raih hadiah

Undang teman & raih hadiah referral

Program Afiliasi

Raih hadiah komisi eksklusif

Bangun pengaruh Anda, raih airdrop

Pembaruan platform real-time

Artikel industri kripto

Diskon Biaya Besar

Solusi pengelolaan aset terpadu

Solusi aset digital perusahaan

Pengembang (API)

Terhubung ke ekosistem aplikasi Gate

Transfer Bank OTC

Setor dan tarik fiat

Mekanisme rebate API yang besar

AI

Partner AI serbaguna untuk Anda

Gunakan Gate AI langsung di aplikasi sosial Anda

Gate Blue Lobster, langsung pakai

Gate for AI Agent

Infrastruktur AI, Gate MCP, Skills, dan CLI

Gate Skills Hub

Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan

Lainnya

Temukan FAQ dan panduan bantuan

Pelajari tentang investasi kripto

Tumbuh bersama para juara

Proof of Reserves

Gate menjanjikan 100% proof of reserve

Jaga keamanan aset Anda

Cursor Mengungkap Teknologi Optimisasi Inferensi MoE Warp Decode, Mencapai Peningkatan Throughput 1.84x pada GPU Blackwell

AirdropBlackHole

2026-04-07 06:19:54

Pembuatan abstrak sedang berlangsung

Menurut pemantauan oleh 1M AI News, alat pemrograman AI Cursor telah merilis sebuah blog teknis yang memperkenalkan metode akselerasi inferensi MoE (Mixture of Experts) buatan sendiri mereka, Warp Decode. Metode ini menargetkan skenario generasi token dengan batch kecil pada GPU Blackwell milik NVIDIA, membalik strategi paralel yang berpusat pada pakar menjadi pendekatan yang berpusat pada output: setiap warp (unit penjadwalan terkecil yang terdiri dari 32 unit pemrosesan paralel) di GPU bertanggung jawab untuk menghitung satu nilai output, secara independen melintasi semua pakar yang dirutekan, dan menyelesaikan akumulasi di register tanpa sinkronisasi antar-warp atau buffer perantara. Pipeline inferensi MoE tradisional terdiri dari 8 tahap, 5 di antaranya semata-mata untuk memindahkan data untuk tampilan pakar tanpa melakukan komputasi aktual. Warp Decode mengompresi seluruh lapisan komputasi MoE menjadi 2 kernel CUDA, menghilangkan langkah-langkah perantara seperti padding, scattering, dan merging, sehingga mengurangi pembacaan/penulisan buffer perantara lebih dari 32KB per token. Diuji pada GPU NVIDIA B200 dengan model bergaya Qwen-3, Warp Decode mencapai peningkatan throughput decoding end-to-end sebesar 1,84x, dan karena komputasi dilakukan sepenuhnya pada presisi BF16/FP32, metode ini menghindari kehilangan kuantisasi perantara, menghasilkan akurasi output yang 1,4 kali lebih dekat ke benchmark FP32 dibandingkan jalur tradisional. Dari segi pemanfaatan bandwidth perangkat keras, dengan ukuran batch 32, metode ini mempertahankan throughput 3,95 TB/s, sekitar 58% dari bandwidth puncak B200 (6,8 TB/s). Optimasi ini secara langsung mempercepat iterasi pengembangan dan kecepatan rilis versi dari model pemrograman buatan sendiri Cursor, Composer.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
SKHynixTopsKOSPIByMarketCap
393,82K Popularitas
#
EthereumFoundationRestructuresForEfficiency
94,25M Popularitas
#
IsraelStrikesIranBTCPlunges
62,41K Popularitas
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
251,84K Popularitas
#
TradFiCFDGoldMaster
2,17M Popularitas

Disematkan