L'équipe de Yann LeCun propose une méthode de planification hiérarchique, améliorant la capacité de raisonnement à long terme du modèle mondial JEPA

robot
Création du résumé en cours

Actualités ME News, 8 avril (UTC+8), récemment, l’équipe de Yann LeCun a proposé une méthode de planification hiérarchique basée sur un modèle du monde latent à plusieurs échelles de temps, visant à résoudre deux grands défis rencontrés par les modèles du monde en apprentissage : l’accumulation d’erreurs de prédiction dans la contrôle à long terme et la croissance exponentielle de l’espace de recherche.
Cette méthode apprend un modèle du monde latent à différentes échelles de temps et exécute une planification hiérarchique inter-échelles, permettant un raisonnement à long terme tout en réduisant considérablement la complexité de la planification lors de l’inférence.
Ce cadre peut servir de module d’abstraction en plugin, adapté à diverses architectures de modèles du monde latent et domaines.
Les expériences montrent qu’en tâche de robot non avide dans le monde réel (comme la prise et la pose), en ne fournissant que l’objectif final, la planification hiérarchique atteint un taux de succès de 70 %, alors que le modèle du monde à une seule couche affiche un taux de succès de 0 %.
Dans des environnements simulés basés sur la physique (comme la manipulation de poussée et la navigation dans un labyrinthe), la planification hiérarchique obtient un taux de réussite plus élevé tout en réduisant jusqu’à trois fois le temps de calcul nécessaire à la planification.
Cette méthode ne dépend pas de récompenses spécifiques à la tâche ni de sous-objectifs fournis par l’extérieur, démontrant une forte capacité de généralisation dans des environnements et tâches non rencontrés auparavant.
(Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler