Batasan memori inferensi LLM akhirnya berhasil dipecahkan dari sudut pandang peningkatan, sehingga skenario pembelajaran daring kini bisa berjalan lebih ringan

Lihat Asli
MeNews
Δ-Mem:Efisiensi Memori Online yang Cocok untuk Model Bahasa Skala Besar
Penelitian mengusulkan Δ-Mem, sebuah sistem memori daring untuk model bahasa besar. Dengan hanya menyimpan perubahan inkremen yang diaktifkan dan memperbarui, mengabaikan status aktivasi lengkap, secara signifikan mengurangi penggunaan memori. Eksperimen menunjukkan penggunaan memori dapat turun hingga 70%, dan kualitas output hampir tidak berkurang, meningkatkan kemampuan inferensi daring dan pembelajaran berkelanjutan di lingkungan dengan sumber daya terbatas.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan