هاجينج فيس تفتح مصدر ml-intern، وكيل أبحاث التعلم الآلي لقراءة الأوراق تلقائيًا، واختيار البيانات، والتدريب

وفقًا للمراقبة التي أجرتها Dongcha Beating، قامت Hugging Face بفتح مصدر ml-intern، وهو وكيل أبحاث تعلم الآلة قادر على إكمال العملية الكاملة بشكل مستقل من “قراءة الأوراق، تنظيم مجموعات البيانات، بدء تدريب GPU، تقييم النتائج، وتحسينات التكرار”. يعتمد المشروع على إطار عملهم الخاص smolagents ويقدم وصولاً عبر واجهة سطر الأوامر والويب، مع توفر الكود على GitHub. تم بناء سلسلة أدوات ml-intern حول نظام Hugging Face البيئي: حيث يسترجع الأوراق من arXiv و HF Papers ويقوم بقراءة عميقة على طول سلاسل الاستشهادات؛ يتصفح مجموعات البيانات على HF Hub، يتحقق من جودتها، يعيد تنسيقها، ثم يدخلها للتدريب؛ عندما لا يتوفر GPU محلي، يمكنه استدعاء HF Jobs لبدء مهام التدريب السحابي، مع قراءة مخرجات التقييم تلقائيًا، وتشخيص أسباب الفشل، وإعادة التشغيل بعد اكتمال التدريب. بشكل افتراضي، يستخدم Claude Sonnet 4.5 لدفع حلقة القرار، مع حد أقصى 300 تكرار لكل تشغيل وضغط تلقائي للسياق الذي يتجاوز 170 ألف رمز. قدمت Hugging Face ثلاث دراسات حالة في منشور إصدارها. في مهمة استدلال علمي، حدد الوكيل مجموعات البيانات OpenScience و NemoTron-CrossThink من سلسلة استشهادات ورقة مرجعية، واستبعد سبعة متغيرات من ARC و SciQ و MMLU بناءً على الصعوبة، وأجرى 12 جولة من التدريب الموجه على Qwen3-1.7B، مما زاد من درجة GPQA من 10% إلى 32% في أقل من 10 ساعات. في سيناريو طبي، حدد الوكيل أن جودة مجموعات البيانات الموجودة غير كافية وكتب تلقائيًا سكربتًا لإنشاء 1100 نقطة بيانات اصطناعية، موسعًا مجموعة البيانات بمقدار 50 مرة للتدريب، متفوقًا على Codex بأكثر من 60% على HealthBench. في سيناريو رياضيات تنافسي، كتب الوكيل بشكل مستقل سكربت تدريب GRPO وبدأ التدريب على A100 عبر HF Spaces، مع ملاحظة انهيار المكافأة وإجراء تجارب استبعاد للتحقيق في السبب.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت