DeepSeek-V4-Flash diluncurkan di Huawei Cloud

Pada 24 April, model DeepSeek-V4 resmi dirilis dan open source, dengan adaptasi pertama dari Huawei Cloud.
Untuk DeepSeek-V4, adaptasi pertama dari Huawei Cloud menggunakan mekanisme kompresi perhatian berlapis model, yang mengimplementasikan pengelolaan alokasi KVCache yang efisien di bawah mekanisme perhatian V4, menyediakan lebih dari 10 operator gabungan berkinerja tinggi Ascend seperti TopK, SWA, CFA, dll., dipadukan dengan optimisasi kerangka kerja seperti penjadwalan asinkron dan spekulasi multi-langkah MTP, mendukung inferensi berkinerja tinggi dengan konteks panjang asli 1M.
Saat ini, platform layanan model MaaS dari Huawei Cloud telah menyediakan layanan Tokens yang memungkinkan pengembang untuk mengakses DeepSeek-V4-Flash API tanpa perlu deployment dan dengan satu klik.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan