El ecosistema AMD finalmente tiene un modelo de lenguaje de difusión competitivo, ¿cuánto ahorró TiDAR en cálculo con esta jugada?

Ver original
MeNews
Zyphra lanza el primer modelo de lenguaje de difusión en el ecosistema AMD, con una aceleración máxima de 7.7 veces
Zyphra lanza ZAYA1-8B-Diffusion-Preview, convirtiendo el modelo de lenguaje autoregresivo en un modelo de difusión de expertos híbridos, convirtiéndose en el primer modelo de difusión de lenguaje entrenado en el ecosistema de hardware AMD. A través de TiDAR, se evita el preentrenamiento desde cero, permitiendo eliminar 16 tokens simultáneamente en una sola pasada, transformando el cuello de botella de memoria de video en un cuello de botella de potencia de cálculo. Las pruebas muestran una aceleración de 4.6x con atención CCA + muestreo sin pérdida, y hasta 7.7x al cambiar al muestreador de logits híbridos.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado