Nvidia merilis Gamma-World, model dunia multi-agen yang mendukung kolaborasi empat orang dan 24 FPS waktu nyata

robot
Pembuatan abstrak sedang berlangsung
ME AI Pesan, berdasarkan pemantauan Beating, para peneliti dari NVIDIA bekerja sama dengan Universitas Tsinghua, Universitas Toronto, dan Institute Vector mempublikasikan model dunia generatif multi-agen Gamma-World, yang memecahkan batasan simulasi lingkungan virtual yang selama ini terbatas pada interaksi satu atau dua pemain. Tim saat ini merilis halaman proyek dan makalah, kode dan bobotnya direncanakan akan dirilis secara open source dalam waktu dekat. Model ini memperkenalkan mekanisme perluasan posisi rotasi berkualitas tinggi dan penanda perantara informasi, yang memastikan bahwa banyak pemain dapat dikendalikan secara independen, dan untuk pertama kalinya, memungkinkan transfer langsung dari zero-shot dua pemain ke kolaborasi empat pemain tanpa perlu pelatihan ulang. Tantangan utama dari model dunia multi-pemain adalah menjaga agar setiap pemain tetap dapat dikendalikan secara independen dan gerakannya tidak saling bertentangan. Tim peneliti merancang enkoding agen rotari sederhana (Simplex Rotary Agent Encoding), yang memperluas enkoding posisi rotasi klasik (RoPE) ke ruang sudut berdimensi tinggi. Metode enkoding baru ini membuat semua pemain memiliki simetri fisik yang sepenuhnya setara, tidak lagi bergantung pada nomor pemain tetap, sehingga memungkinkan referensi dan pengendalian yang lebih alami dan independen. Untuk mencegah peningkatan komputasi secara kuadratik saat jumlah pemain bertambah, solusi ini memperkenalkan mekanisme perhatian pusat jarang (Sparse Hub Attention). Sistem ini mentransfer informasi interaksi melalui penanda pusat yang dapat dipelajari, sehingga biaya perhitungan perhatian antar pemain berhasil dikompresi menjadi tingkat linier. Dalam hal kecepatan generasi, tim mengompilasi model difusi berlatensi tinggi menjadi model kausal melalui distilasi, dan dengan menggunakan cache kunci-nilai (KV Cache), menghasilkan respons gerak real-time sebanyak 24 frame per detik (24 FPS). Evaluasi lingkungan permainan multi-pemain menunjukkan bahwa model baru ini secara signifikan lebih unggul dibandingkan jaringan perhatian slot dan jaringan perhatian padat dalam hal realisme visual, kontrol respons gerak, dan konsistensi antar pemain. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • 2
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
GateUser-b74aba1c
· 5jam yang lalu
Perhatian Hub Sparse menurun menjadi biaya linier, akhirnya tidak perlu lagi melihat PPT
Lihat AsliBalas0
MemeFisher
· 6jam yang lalu
KV cache + distilasi guru, optimisasi proyek sudah maksimal.
Lihat AsliBalas0
GlassDomeObservatory
· 6jam yang lalu
Kontrol tampilan lebih unggul dari jaringan tradisional, model dunia generatif akan menjadi
Lihat AsliBalas0
LiquidityLibrarian
· 6jam yang lalu
Setelah selesai membaca, ingin mencoba mereplikasi, tetapi menemukan kekurangan kartu.
Lihat AsliBalas0
ArbiterOfFees
· 7jam yang lalu
Nvidia kali ini bertaruh pada dunia game yang dihasilkan AI
Lihat AsliBalas0
ProofOfVibes
· 7jam yang lalu
Mengendalikan titik ini secara independen oleh setiap pemain sangat penting, banyak solusi sebelumnya tidak mampu melakukannya
Lihat AsliBalas0
MarginMarmot
· 7jam yang lalu
Dari dua orang langsung ke empat orang, medan perang baru dalam Hukum Skala
Lihat AsliBalas0
SentimentIndicatorHarvester
· 7jam yang lalu
Jaringan Tradisional: Apakah kalian sopan
Lihat AsliBalas0
  • Disematkan