Mila apresenta 70 artigos no ICLR 2026, cobrindo áreas de ponta como fusão de modelos e aprendizado de grafos.

robot
Geração do resumo em andamento
ME News消息,4月23日(UTC+8),Mila宣布其研究人员将在ICLR 2026(巴西)上展示70篇论文。首日亮点包括:模型合并与微调方面,DisTaC通过蒸馏条件任务向量实现鲁棒模型合并,一项研究采用epsilon调度缓解非鲁棒预训练模型微调的次优迁移问题,口头报告揭示单次全局合并策略在去中心化学习中的有效性;图学习领域,GraphOmni提出评估大语言模型在图论任务表现的基准框架,另一工作澄清Transformer过平滑误解;强化学习方面,SHAPO引入锐度感知优化用于安全探索,ARM-FM利用基础模型自动生成奖励机,分层值分解离线强化学习方法应用于全身控制,不对称近端策略优化通过小型评论家提升大语言模型推理能力;生成模型领域,Efficient Regression-based Training of Normalizing Flows for Boltzmann Generators提出高效回归训练方法,FALCON实现连续流少步精确似然计算,Contractive Diffusion Policies通过收缩性得分采样增强动作扩散鲁棒性;大语言模型相关:Landscape of Thoughts可视化推理过程,Model Collapse被重新定义为机器遗忘特征而非缺陷,Beyond Multi-Token Prediction通过未来摘要预训练,Visual symbolic mechanisms探索视觉语言模型符号处理;其他亮点包括高分辨率热带树冠检测数据集SelvaBox、学习优化器的计算高效元泛化µLO、面向时序图的高效模块化库TGM,以及通过因果规则提升奖励建模鲁棒性的Robust Reward Modeling。(来源:InFoQ)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários