ME News mensagem: Em 23 de abril (UTC+8), a Mila anunciou que seus investigadores apresentarão 70 artigos no ICLR 2026 (Brasil). Os destaques do primeiro dia incluem: Fusão e ajuste fino de modelos — DisTaC alcança fusão robusta de modelos através de vetores de tarefas de destilação condicional; um estudo utiliza escalonamento epsilon para mitigar problemas de transferência subótima no ajuste fino de modelos pré-treinados não robustos; uma apresentação oral revela a eficácia da estratégia de fusão global única em aprendizagem descentralizada. Na área de aprendizagem em grafos, o GraphOmni propõe uma estrutura de referência para avaliar o desempenho de modelos de linguagem de grande escala em tarefas de teoria de grafos; outro trabalho clarifica o equívoco do sobreamortecimento em Transformers. Em aprendizagem por reforço, o SHAPO introduz otimização sensível à nitidez para exploração segura; o ARM-FM utiliza modelos de base para gerar automaticamente máquinas de recompensa; um método de decomposição hierárquica de valores em aprendizagem por reforço offline é aplicado ao controlo de corpo inteiro; a otimização de política proximal assimétrica melhora a capacidade de raciocínio de modelos de linguagem de grande escala através de críticos pequenos. No domínio dos modelos generativos, o Efficient Regression-based Training of Normalizing Flows for Boltzmann Generators propõe um método de treino de regressão eficiente; o FALCON realiza cálculo de verosimilhança exata em poucos passos para fluxos contínuos; as Contractive Diffusion Policies aumentam a robustez da difusão de ações através de amostragem de pontuação contráctil. Relacionado com modelos de linguagem de grande escala: o Landscape of Thoughts visualiza o processo de raciocínio; o Model Collapse é redefinido como uma característica de esquecimento da máquina, não um defeito; o Beyond Multi-Token Prediction utiliza pré-treino com sumários futuros; mecanismos simbólicos visuais exploram o processamento simbólico em modelos de linguagem visual. Outros destaques incluem o conjunto de dados de alta resolução para deteção de copas de árvores tropicais SelvaBox, a meta-generalização computacionalmente eficiente de otimizadores de aprendizagem µLO, a biblioteca modular eficiente para grafos temporais TGM, e a Robust Reward Modeling que melhora a robustez da modelação de recompensas através de regras causais. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
SKHynixTopsKOSPIByMarketCap
1,64M Popularidade
#
MicronEarningsBeatExpectationsSharesRise
353,5K Popularidade
#
IsraelStrikesIranBTCPlunges
65,29K Popularidade
#
PredictWorldCupShare20000U
129K Popularidade
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
195,96K Popularidade

Fixado

Mila apresenta 70 artigos no ICLR 2026, cobrindo fronteiras como fusão de modelos e aprendizagem de grafos.

Tópicos em destaque

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fixado