Tsinghua + sisi gelap bulan kombinasi ini cukup menarik, lempar prefill ke pusat data jarak jauh, belenggu RDMA akhirnya terlepas.

Lihat Asli
MeNews
Sisi Gelap Bulan dan Makalah Baru Tsinghua: Pra-pengisian LLM dapat melintasi pusat data, throughput model 1T meningkat 54%
ME News Tin tức, 18 April (UTC+8), menurut pemantauan Beating dari Dongcha, Moonshot AI dan Universitas Tsinghua pada 16 April mempublikasikan makalah baru di arXiv berjudul "Prefill-as-a-Service", yang mengusulkan agar tahap pra-pengisian (prefill) inferensi model besar berjalan lintas pusat data. Inferensi model besar terdiri dari dua langkah: prefill membaca input secara sekaligus dan menghasilkan cache KV; decode kemudian mengeluarkan hasil secara kata demi kata berdasarkan cache tersebut. Kedua langkah membutuhkan karakteristik perangkat keras yang sama sekali berbeda, prefill membutuhkan daya komputasi, decode membutuhkan memori grafis dan bandwidth. Pendekatan utama di industri adalah memisahkan kedua langkah ke mesin yang berbeda (PD terpisah), tetapi ini mengharuskan kedua sisi terhubung melalui RDMA di pusat data yang sama, karena kepadatan
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan