Código aberto do planejador de modelos mundiais GRASP retuitado por Yann LeCun

robot
Geração de resumo em curso

Notícias ME, mensagem de 1 de abril (UTC+8), o código open source do planeador de novos modelos GRASP, publicado por Michael Psenka e reencaminhado por Yann LeCun, já foi disponibilizado. A GRASP é um planejador de gradiente estocástico paralelo para aprender modelos do mundo, cuja ideia central é otimizar, em conjunto, as ações e os intermédios “virtuais” no espaço de trajetórias melhoradas. Ela garante a consistência com o modelo dinâmico aprendido através de uma penalização de consistência da dinâmica e permite um planeamento eficiente e paralelo. As principais opções de design incluem a introdução de estados virtuais que podem ser calculados em paralelo, a exploração do espaço de estados através de ruído, o uso de uma técnica de stop gradient para impedir que o fluxo de gradientes chegue às entradas de estados do modelo de visão de alta dimensão, e a combinação de modelação de objetivos e passos periódicos de expansão sequencial sincronizada para garantir a estabilidade. Este planeador é construído sobre o projeto DINO-WM, mas também pode ser integrado com outros modelos do mundo (como LeWorldModel e JEPA-WMs) através de adaptadores, sendo adequado para vários ambientes, como PushT e TwoRoom. O repositório de código fornece a implementação da lógica central do algoritmo e scripts de instalação dos adaptadores. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar