El equipo de Yann LeCun propuso un método de planificación jerárquica para mejorar la capacidad de razonamiento en largo plazo del modelo mundial JEPA.

robot
Generación de resúmenes en curso

NOTICIAS ME, 8 de abril (UTC+8), recientemente, el equipo de Yann LeCun propuso un método de planificación jerárquica basado en un modelo de mundo latente de múltiples escalas de tiempo, con el objetivo de abordar los dos grandes desafíos que enfrentan los modelos de mundo de aprendizaje: la acumulación de errores de predicción en el control a largo plazo y el crecimiento exponencial del espacio de búsqueda.
Este método aprende modelos de mundo latente en diferentes escalas de tiempo y realiza planificación jerárquica entre escalas, logrando razonamiento a largo plazo y reduciendo significativamente la complejidad de planificación durante la inferencia.
Este marco puede servir como un módulo de abstracción tipo plugin, aplicable a varias arquitecturas de modelos de mundo latente y dominios.
Los experimentos muestran que, en tareas de robots en el mundo real no codiciosas (como agarrar y soltar), solo con el objetivo final, la planificación jerárquica logra una tasa de éxito del 70%, mientras que el modelo de mundo de una sola capa tiene una tasa de éxito del 0%.
En entornos de simulación basados en física (como operaciones de empuje y navegación en laberintos), la planificación jerárquica obtiene tasas de éxito más altas y reduce hasta 3 veces el tiempo de cálculo necesario para la planificación.
Este método no depende de recompensas específicas de la tarea ni de subobjetivos proporcionados externamente, demostrando una fuerte capacidad de generalización en entornos y tareas no vistos. (Fuente: InFoQ)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado