Mila 在 ICLR 2026 展示 70 篇论文,覆盖模型合并与图学习等前沿

robot
摘要生成中
ME News 消息,4 月 23 日(UTC+8),Mila 宣布其研究人员将在 ICLR 2026(巴西)上展示 70 篇论文。首日亮点包括:模型合并与微调方面,DisTaC 通过蒸馏条件任务向量实现鲁棒模型合并,一项研究采用 epsilon 调度缓解非鲁棒预训练模型微调的次优迁移问题,口头报告揭示单次全局合并策略在去中心化学习中的有效性;图学习领域,GraphOmni 提出评估大语言模型在图论任务表现的基准框架,另一工作澄清 Transformer 过平滑误解;强化学习方面,SHAPO 引入锐度感知优化用于安全探索,ARM-FM 利用基础模型自动生成奖励机,分层值分解离线强化学习方法应用于全身控制,不对称近端策略优化通过小型评论家提升大语言模型推理能力;生成模型领域,Efficient Regression-based Training of Normalizing Flows for Boltzmann Generators 提出高效回归训练方法,FALCON 实现连续流少步精确似然计算,Contractive Diffusion Policies 通过收缩性得分采样增强动作扩散鲁棒性;大语言模型相关:Landscape of Thoughts 可视化推理过程,Model Collapse 被重新定义为机器遗忘特征而非缺陷,Beyond Multi-Token Prediction 通过未来摘要预训练,Visual symbolic mechanisms 探索视觉语言模型符号处理;其他亮点包括高分辨率热带树冠检测数据集 SelvaBox、学习优化器的计算高效元泛化 µLO、面向时序图的高效模块化库 TGM,以及通过因果规则提升奖励建模鲁棒性的 Robust Reward Modeling。(来源:InFoQ)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论