Cola DLM memasukkan teks ke dalam ruang tersembunyi kontinu lalu menyebar, pilihan arsitektur Flow Matching+DiT sangat khas Byte—rasa engineering yang kuat, tapi tanpa SFT tanpa RLHF dari checkpoint mentah, sekarang hanya sebatas mainan riset, tunggu pipeline multimodal keluar untuk melihat apakah bisa bersaing.

Lihat Asli
MeNews
ByteDance membuka sumber Cola DLM: Mendefinisikan ulang pembuatan teks dengan model difusi
ByteDance Seed open-source Cola DLM, adalah sebuah model yang melakukan penyebaran teks di tingkat makna potensial. Text VAE memetakan teks ke ruang potensial kontinu, block-causal DiT mempelajari prior potensial melalui Flow Matching, dan akhirnya decoder kondisi mengembalikan variabel potensial menjadi teks. Jumlah parameter sekitar 2,3 miliar (DiT 1,8 miliar, VAE 500 juta). Dalam 8 evaluasi, bersaing dan berada di depan baseline AR/LLaDA dengan skala yang sama, tetapi tetap merupakan checkpoint penelitian, belum melalui fine-tuning instruksi atau RLHF, repositori saat ini hanya berisi pipeline teks, dan di masa depan mungkin akan diperluas ke teks-gambar.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan