NVIDIA NeMo RL mendukung pelatihan penguatan lanjutan presisi rendah FP8, mempercepat iterasi agen.

robot
Pembuatan abstrak sedang berlangsung
ME News Pesan, 23 April (UTC+8), NVIDIA AI baru-baru ini mengumumkan bahwa pustaka sumber terbuka mereka, NVIDIA NeMo RL, telah menambahkan kemampuan baru, yaitu mendukung pelatihan pasca-penguatan (RL) menggunakan format presisi rendah FP8 untuk mempercepat beban kerja komputasi terkait. Menurut informasi yang dirilis, pada model Qwen3-8B-Base, penggunaan format FP8 dapat meningkatkan kecepatan beban kerja RL sebesar 1,48 kali. Percepatan ini bertujuan untuk memberikan siklus iterasi yang lebih cepat dalam penggunaan alat oleh agen dan tugas multi-langkah. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan