A equipa de Yann LeCun propôs um método de planeamento em camadas, melhorando a capacidade de raciocínio de longo prazo do modelo mundial JEPA

robot
Geração de resumo em curso

ME News Notícias, 8 de abril (UTC+8), recentemente, a equipe de Yann LeCun propôs um método de planejamento hierárquico baseado em modelos de mundo latentes de múltiplas escalas de tempo, com o objetivo de resolver dois grandes desafios enfrentados por modelos de mundo aprendizes em controle de longo prazo: a acumulação de erros de previsão e o crescimento exponencial do espaço de busca.
Este método aprende modelos de mundo latentes em diferentes escalas de tempo e executa planejamento hierárquico entre escalas, permitindo raciocínio de longo prazo, ao mesmo tempo que reduz significativamente a complexidade do planejamento durante a inferência.
Este quadro pode atuar como um módulo de abstração plugável, adequado para várias arquiteturas de modelos de mundo latentes e domínios.
Experimentos mostram que, em tarefas de robótica não gananciosa do mundo real (como pegar e soltar), apenas com o objetivo final fornecido, o planejamento hierárquico alcançou uma taxa de sucesso de 70%, enquanto o modelo de mundo de camada única teve uma taxa de sucesso de 0%.
Em ambientes de simulação baseados em física (como operações de empurrar e navegação em labirintos), o planejamento hierárquico obteve uma taxa de sucesso mais alta e reduziu até 3 vezes o tempo de cálculo necessário para o planejamento.
Este método não depende de recompensas específicas da tarefa ou de subobjetivos fornecidos externamente, demonstrando uma forte capacidade de generalização em ambientes e tarefas não vistos.
(Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar