ميلا تعرض 70 ورقة بحثية في ICLR 2026، تغطي مجالات متقدمة مثل دمج النماذج وتعلم الرسوم البيانية.

robot
إنشاء الملخص قيد التقدم
أخبار ME، في 23 أبريل (UTC+8)، أعلنت Mila أن باحثيها سيعرضون 70 ورقة بحثية في ICLR 2026 (البرازيل). تشمل أبرز أحداث اليوم الأول: في مجال دمج النماذج وضبطها الدقيق، يحقق DisTaC دمجًا قويًا للنماذج من خلال ناقلات المهام المشروطة بالتقطير، وتستخدم دراسة جدولة إبسيلون للتخفيف من مشكلة النقل غير الأمثل عند ضبط النماذج الأولية غير القوية، ويكشف العرض التقديمي الشفهي عن فعالية استراتيجية الدمج الشامل الأحادي في التعلم اللامركزي؛ في مجال تعلم الرسوم البيانية، يقترح GraphOmni إطارًا مرجعيًا لتقييم أداء نماذج اللغة الكبيرة في مهام نظرية الرسوم البيانية، وتوضح دراسة أخرى سوء فهم التمليس المفرط في Transformer؛ في مجال التعلم المعزز، يقدم SHAPO تحسين الحدة من أجل الاستكشاف الآمن، ويستخدم ARM-FM النماذج الأساسية لتوليد آلات المكافآت تلقائيًا، ويُطبق تحليل القيمة الهرمية بالتعلم المعزز غير المتصل على التحكم في الجسم بالكامل، ويعزز تحسين السياسة غير المتماثل القريب قدرة الاستدلال لنماذج اللغة الكبيرة من خلال ناقد صغير؛ في مجال النماذج التوليدية، يقترح Efficient Regression-based Training of Normalizing Flows for Boltzmann Generators طريقة تدريب انحدارية فعالة، ويحقق FALCON حسابًا دقيقًا للاحتمالية بخطوات قليلة في التدفق المستمر، وتعزز Contractive Diffusion Policies متانة نشر الإجراءات من خلال تسجيل الانكماش؛ متعلق بنماذج اللغة الكبيرة: تصور Landscape of Thoughts عملية الاستدلال، ويعاد تعريف Model Collapse كسمة من سمات النسيان الآلي بدلاً من العيب، وما بعد التنبؤ متعدد الرموز عبر التلخيص المستقبلي المسبق، وتستكشف Visual symbolic mechanisms المعالجة الرمزية في النماذج البصرية اللغوية؛ تشمل النقاط البارزة الأخرى مجموعة بيانات كشف قمم الأشجار الاستوائية عالية الدقة SelvaBox، والتعميم الفوقي الفعال حسابيًا لمحسنات التعلم µLO، ومكتبة معيارية فعالة للرسوم البيانية الزمنية TGM، ونمذجة مكافآت قوية عبر القواعد السببية Robust Reward Modeling. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت