Mensaje de CoinWorld, OneMillion\_AI publicó que, la pila de entrenamiento paralelo de código abierto SkyRL ha logrado una autoevolución de modelos grandes en horas, con un aumento de 2.81 veces en el rendimiento general de los experimentos, y una mejora de aproximadamente 3.25 veces en el rendimiento absoluto por nodo en tiempo. Esta arquitectura mantiene permanentemente en la memoria de la GPU la base compartida del modelo, reduciendo el costo de arranque en frío al cargar modelos gigantes repetidamente, con el objetivo de ayudar a los desarrolladores a realizar entrenamiento de datos en tiempo real para modelos grandes con un costo de memoria extremadamente bajo.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 9
  • 3
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Wax-SealedPrivateKey
· Hace37m
¿Cuánto se puede reducir el costo de entrenamiento con un rendimiento 2.81 veces mayor?
Ver originalResponder0
FeeTakerPhD
· hace22h
Evolución propia a nivel de horas, parece que la hoja de ruta de la AGI se adelanta otra vez
Ver originalResponder0
MempoolMaggie
· hace22h
Aumento de 3.25 veces en un solo nodo, incluso equipos pequeños pueden trabajar con grandes modelos
Ver originalResponder0
MevHasMeCompletelyConfused.
· hace23h
La optimización de la memoria de video siempre es un punto delicado, esta solución ha llegado al núcleo.
Ver originalResponder0
SlowerThanBlock
· hace23h
Entrenamiento de datos de producción en tiempo real, el espacio de imaginación para escenarios de implementación es muy grande
Ver originalResponder0
GateUser-2d7346e0
· hace23h
La idea de diseño de la base permanente es bastante ingeniosa, evita la repetición de E/S.
Ver originalResponder0
ExitLiquidityBuddy
· hace23h
El nombre SkyRL es bastante genial, ¿el código es de código abierto? Por favor, comparte el enlace.
Ver originalResponder0
GateUser-ad8b77bd
· hace23h
El entrenamiento de modelos grandes se reduce a horas, la velocidad de iteración es aterradora.
Ver originalResponder0
Mirror-FinishTeacupWith
· hace23h
Código abierto + bajo costo de memoria, esta combinación es muy amigable para los desarrolladores
Ver originalResponder0
Ver más
  • Fijado