Model inferensi AI fisika Nvidia Cosmos-Reason2 open source bobot flagship 32B

Menurut pemantauan Beating, NVIDIA membuka model Cosmos-Reason2-32B.
Cosmos Reason 2 adalah model AI fisika inferensi visual bahasa (VLM) yang dirilis NVIDIA akhir tahun lalu (mengolah gambar, video, dan teks secara bersamaan), khusus mengajarkan robot dan sistem mengemudi otomatis memahami ruang, waktu, dan hukum fisika dasar.
Pada saat itu hanya membuka model versi kecil dengan 2 miliar dan 8 miliar parameter, model flagship 320 miliar parameter baru pertama kali dipublikasikan hingga sekarang.
Basisnya adalah通义千问 Qwen3-VL-32B-Instruct, lisensi model terbuka NVIDIA dapat digunakan secara komersial.

Berikan rekaman video mengemudi, model ini dapat menilai secara langsung apakah belok kanan aman;
berikan sebuah foto gudang, model ini dapat menandai koordinat 2D/3D dan kotak batas setiap barang.
Tiga penggunaan utama: menganalisis aliran video di kota dan industri, penandaan data sensor secara massal, serta sebagai otak perencanaan untuk robot humanoid dan kendaraan otomatis.
Dibandingkan generasi sebelumnya, penambahan deteksi objek dan penentuan waktu yang akurat, jendela konteks diperluas hingga 256K token.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan