ByteDance akhirnya merilis model bahasa penyebaran, 23B parameter melakukan generasi teks di ruang laten, ide nya cukup berani.

Lihat Asli
MeNews
ByteDance membuka sumber Cola DLM: Mendefinisikan ulang pembuatan teks dengan model difusi
ByteDance Seed open-source Cola DLM, adalah sebuah model yang melakukan penyebaran teks di tingkat semantik potensial. Text VAE memetakan teks ke ruang potensial kontinu, block-causal DiT mempelajari prior potensial melalui Flow Matching, dan akhirnya decoder kondisi mengembalikan variabel potensial menjadi teks. Jumlah parameter sekitar 2,3 miliar (DiT 1,8 miliar, VAE 500 juta). Dalam 8 evaluasi, bersaing dan berada di depan baseline AR/LLaDA dengan skala yang sama, tetapi masih merupakan checkpoint penelitian, belum melalui fine-tuning instruksi atau RLHF, repositori saat ini hanya berisi pipeline teks, dan di masa depan mungkin akan diperluas ke teks-gambar.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan