El primer modelo de lenguaje de difusión en el ecosistema AMD, TiDAR, omite directamente el preentrenamiento, y la idea de eliminar ruido en paralelo con 16 tokens es bastante audaz, aprendí que la operación de convertir memoria de video en potencia de cálculo es un cuello de botella.

Ver original
MeNews
Zyphra lanza el primer modelo de lenguaje de difusión en el ecosistema AMD, con una aceleración máxima de 7.7 veces
Zyphra lanza ZAYA1-8B-Diffusion-Preview, que convierte el gran modelo de lenguaje autoregresivo en un modelo de difusión de expertos híbridos, convirtiéndose en el primer modelo de difusión de lenguaje entrenado en el ecosistema de hardware AMD. A través de TiDAR, se evita el preentrenamiento desde cero, permitiendo eliminar 16 tokens simultáneamente en una sola pasada, transformando el cuello de botella de memoria de video en un cuello de botella de potencia de cálculo. Las pruebas muestran una aceleración de 4.6x con atención CCA + muestreo sin pérdida, y hasta 7.7x al cambiar al muestreador de logits híbridos.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado