Según noticias de Jiemian, ME News, el 10 de marzo (UTC+8), y de acuerdo con 1M AI News, el equipo de Tencent Hunyuan 3D ha abierto el código del primer marco de entrenamiento posterior de aprendizaje por refuerzo para modelos globales, llamado WorldCompass. WorldCompass está diseñado específicamente como un marco de aprendizaje por refuerzo (RL) para modelos de mundo interactivos y de secuencias largas. Si se dice que el modelo global es un motor, entonces WorldCompass es la «brújula» precisa que, mediante la incorporación de mecanismos de aprendizaje por refuerzo, «guía» directamente al modelo para que siga de manera más precisa las instrucciones del usuario al explorar el mundo y mantenga la coherencia visual en secuencias largas.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado