ME News メッセージ、4月23日(UTC+8)、Milaは研究者がICLR 2026(ブラジル)で70本の論文を発表することを発表。初日のハイライトは以下の通り:モデルマージとファインチューニングでは、DisTaCが蒸留条件タスクベクトルによるロバストモデルマージを実現、ある研究がイプシロンスケジューリングを用いて非ロバスト事前学習モデルのファインチューニングにおける準最適転移問題を緩和、口頭発表では分散学習における単一グローバルマージ戦略の有効性を解明;グラフ学習分野では、GraphOmniが大規模言語モデルのグラフ理論タスクにおけるパフォーマンスを評価するベンチマークフレームワークを提案、別の研究がTransformerの過平滑化の誤解を解消;強化学習では、SHAPOが安全探索向けにシャープネス認識最適化を導入、ARM-FMが基礎モデルを利用して報酬関数を自動生成、階層値分解オフライン強化学習手法を全身制御に適用、非対称近位方策最適化が小型批評家により大規模言語モデルの推論能力を向上;生成モデル分野では、Efficient Regression-based Training of Normalizing Flows for Boltzmann Generatorsが効率的回帰学習手法を提案、FALCONが連続フロー少ステップ正確尤度計算を実現、Contractive Diffusion Policiesが収縮性スコアサンプリングによりアクション拡散のロバスト性を強化;大規模言語モデル関連:Landscape of Thoughtsが推論過程を可視化、Model Collapseは欠陥ではなく機械忘却特性として再定義、Beyond Multi-Token Predictionが未来要約事前学習を通じて、Visual symbolic mechanismsが視覚言語モデルの記号処理を探究;その他のハイライトには高解像度熱帯樹冠検出データセットSelvaBox、学習オプティマイザの計算効率的メタ汎化µLO、時系列グラフ向け効率的モジュール型ライブラリTGM、因果ルールによる報酬モデリングのロバスト性向上Robust Reward Modelingが含まれる。(出典:InFoQ)
Mila は ICLR 2026 で 70 本の論文を発表し、モデルマージやグラフ学習などの最先端をカバーしています。