A equipa de Yann LeCun propôs um método de planeamento em camadas, melhorando a capacidade de raciocínio de longo prazo do modelo mundial JEPA

robot
Geração de resumo em curso

Notícias do ME News, 8 de abril (UTC+8), recentemente, a equipa de Yann LeCun propôs um método de planeamento hierárquico baseado em modelos de mundo latentes de múltiplas escalas de tempo, com o objetivo de resolver os dois principais desafios enfrentados pelos modelos de mundo de aprendizagem na controlo de longos períodos de tempo: a acumulação de erros de previsão e o crescimento exponencial do espaço de busca.
Este método aprende modelos de mundo latentes em diferentes escalas de tempo e executa planeamento hierárquico entre escalas, permitindo raciocínio de longo prazo, ao mesmo tempo que reduz significativamente a complexidade do planeamento durante a inferência.
Este quadro pode atuar como um módulo de abstração plugável, adequado a várias arquiteturas de modelos de mundo latentes e domínios.
Os experimentos mostram que, em tarefas de robótica não gananciosa do mundo real (como agarrar e soltar), apenas com o objetivo final fornecido, o planeamento hierárquico alcançou uma taxa de sucesso de 70%, enquanto o modelo de mundo de camada única teve uma taxa de sucesso de 0%.
Em ambientes de simulação baseados em física (como operações de empurrar e navegação em labirintos), o planeamento hierárquico obteve taxas de sucesso mais elevadas e reduziu até 3 vezes o tempo de cálculo necessário para o planeamento.
Este método não depende de recompensas específicas da tarefa ou de sub-objetivos fornecidos externamente, demonstrando uma forte capacidade de generalização para ambientes e tarefas não vistos.
(Origem: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar