Cola DLM inserta el texto en un espacio latente continuo y luego difunde, la elección de arquitectura Flow Matching+DiT es muy Byte—con un fuerte sabor a ingeniería, pero sin SFT ni RLHF en el punto de control sin procesar, ahora es solo un juguete de investigación, a la espera de que salga la línea multimodal para ver si puede competir.

Ver original
MeNews
ByteDance abre el código abierto de Cola DLM: redefiniendo la generación de texto con modelos de difusión
ByteDance Seed de código abierto Cola DLM, es un modelo que realiza difusión de texto en una capa de semántica potencial.
Text VAE mapea el texto a un espacio latente continuo,
block-causal DiT aprende la priorización latente mediante Flow Matching,
finalmente, el decodificador condicional restaura las variables latentes en texto.
El total de parámetros es aproximadamente 2.3 mil millones (DiT 1.8 mil millones, VAE 500 millones).
En 8 evaluaciones, compite y se posiciona entre los primeros con la línea base AR/LLaDA del mismo tamaño,
pero sigue siendo un punto de control de investigación, sin ajuste fino por instrucciones ni RLHF,
el repositorio actual solo contiene la línea de texto,
y en el futuro podría expandirse a texto-imagen.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado