Model AI Menara Kembar NVIDIA dirilis sebagai sumber terbuka, kecepatan pembuatan teks meningkat 2,42 kali lipat, kualitas gambar dipertahankan 98,7%.

ME AI Berita, NVIDIA merilis model bahasa difusi diskrit Nemotron-Labs-TwoTower, mengatasi masalah kecepatan generasi token demi token yang lambat pada model besar, bobot telah dibuka sumbernya di Huggingface. Model ini menggunakan kembali bobot pra-pelatihan backbone yang ada, tidak perlu pelatihan dari awal, secara signifikan mengurangi biaya. Mengadopsi arsitektur menara ganda 60B, dua jaringan 30B bekerja sama secara paralel, setiap menara mengaktifkan parameter 3B dan dilengkapi dengan 128 modul ahli yang dapat dirutekan, meningkatkan efisiensi generasi. (Sumber: MLion)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan