A equipa de Yann LeCun propôs um método de planeamento em camadas, melhorando a capacidade de raciocínio de longo prazo do modelo mundial JEPA

robot
Geração de resumo em curso
Notícias ME, 8 de abril (UTC+8), recentemente, a equipa de Yann LeCun propôs um método de planeamento hierárquico baseado em modelos de mundo latentes de múltiplas escalas de tempo, com o objetivo de resolver os dois principais desafios enfrentados pelos modelos de mundo aprendidos na previsão de erros acumulados em controlo de longo prazo e no crescimento exponencial do espaço de busca.
Este método aprende modelos de mundo latentes em diferentes escalas de tempo e executa planeamento hierárquico entre escalas, permitindo raciocínio de longo prazo, ao mesmo tempo que reduz significativamente a complexidade do planeamento durante a inferência.
Este quadro pode atuar como um módulo de abstração plug-in, adequado para várias arquiteturas de modelos de mundo latentes e domínios.
Os experimentos mostram que, em tarefas de robótica não gananciosa do mundo real (como agarrar e soltar), apenas com o objetivo final, o planeamento hierárquico alcançou uma taxa de sucesso de 70%, enquanto o modelo de mundo de camada única teve uma taxa de sucesso de 0%.
Em ambientes de simulação baseados em física (como operações de empurrar e navegação em labirintos), o planeamento hierárquico obteve uma taxa de sucesso mais elevada e reduziu até 3 vezes o tempo de cálculo necessário para o planeamento.
Este método não depende de recompensas específicas da tarefa ou de sub-objetivos fornecidos externamente, demonstrando uma forte capacidade de generalização em ambientes e tarefas não vistos.
(Origem: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado