Mila apresenta 70 artigos no ICLR 2026, cobrindo fronteiras como fusão de modelos e aprendizagem de grafos.

robot
Geração de resumo em curso
ME News mensagem: Em 23 de abril (UTC+8), a Mila anunciou que seus investigadores apresentarão 70 artigos no ICLR 2026 (Brasil). Os destaques do primeiro dia incluem: Fusão e ajuste fino de modelos — DisTaC alcança fusão robusta de modelos através de vetores de tarefas de destilação condicional; um estudo utiliza escalonamento epsilon para mitigar problemas de transferência subótima no ajuste fino de modelos pré-treinados não robustos; uma apresentação oral revela a eficácia da estratégia de fusão global única em aprendizagem descentralizada. Na área de aprendizagem em grafos, o GraphOmni propõe uma estrutura de referência para avaliar o desempenho de modelos de linguagem de grande escala em tarefas de teoria de grafos; outro trabalho clarifica o equívoco do sobreamortecimento em Transformers. Em aprendizagem por reforço, o SHAPO introduz otimização sensível à nitidez para exploração segura; o ARM-FM utiliza modelos de base para gerar automaticamente máquinas de recompensa; um método de decomposição hierárquica de valores em aprendizagem por reforço offline é aplicado ao controlo de corpo inteiro; a otimização de política proximal assimétrica melhora a capacidade de raciocínio de modelos de linguagem de grande escala através de críticos pequenos. No domínio dos modelos generativos, o Efficient Regression-based Training of Normalizing Flows for Boltzmann Generators propõe um método de treino de regressão eficiente; o FALCON realiza cálculo de verosimilhança exata em poucos passos para fluxos contínuos; as Contractive Diffusion Policies aumentam a robustez da difusão de ações através de amostragem de pontuação contráctil. Relacionado com modelos de linguagem de grande escala: o Landscape of Thoughts visualiza o processo de raciocínio; o Model Collapse é redefinido como uma característica de esquecimento da máquina, não um defeito; o Beyond Multi-Token Prediction utiliza pré-treino com sumários futuros; mecanismos simbólicos visuais exploram o processamento simbólico em modelos de linguagem visual. Outros destaques incluem o conjunto de dados de alta resolução para deteção de copas de árvores tropicais SelvaBox, a meta-generalização computacionalmente eficiente de otimizadores de aprendizagem µLO, a biblioteca modular eficiente para grafos temporais TGM, e a Robust Reward Modeling que melhora a robustez da modelação de recompensas através de regras causais. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado