Chip Huawei memperlambat peluncuran DeepSeek V4? Kernel yang sama mendukung NVIDIA dan Ascend serta mempercepat hampir 2 kali lipat.

robot
Pembuatan abstrak sedang berlangsung
ME News melaporkan, 24 April (UTC+8), menurut pemantauan Beating, sebelum peluncuran DeepSeek V4, komunitas luas menyebarkan tebakan: V4 dirilis lebih lambat dari yang diharapkan karena model menghadapi kesulitan adaptasi saat bermigrasi dari NVIDIA ke platform Huawei Ascend. Laporan teknis V4 tidak secara langsung menanggapi rumor ini, tetapi data kinerja yang diungkapkan jelas bertentangan dengannya. Laporan menunjukkan bahwa skema partisi pakar berbutir halus (Fine-Grained EP Scheme) V4 telah divalidasi dan di-deploy di dua platform, yaitu NVIDIA GPU dan Huawei Ascend NPU, dengan akselerasi beban inferensi reguler sebesar 1,50 hingga 1,73 kali, dan akselerasi tertinggi hingga 1,96 kali dalam skenario sensitif latensi seperti RL rollout dan layanan Agen kecepatan tinggi. Tim telah membuka sumber kernel versi CUDA MegaMoE sebagai bagian dari DeepGEMM. Dengan kata lain, V4 berjalan mendekati batas efisiensi teoretis di kedua perangkat keras, dan adaptasi lintas platform tidak menyebabkan penurunan kinerja. (Sumber: BlockBeats)
DEEPSEEK-1,45%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan