Hugging Face مفتوح المصدر ml-intern، وكيل أبحاث التعلم الآلي الذي يقرأ الأوراق البحثية تلقائيًا، يختار البيانات، ويشغل عمليات التدريب

robot
إنشاء الملخص قيد التقدم
أخبار ME News، 22 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أطلقت Hugging Face مشروع ml-intern مفتوح المصدر، وهو وكيل أبحاث تعلم آلي قادر على إتمام كامل عملية «قراءة الأوراق البحثية، تنظيم مجموعات البيانات، بدء تدريب GPU، تقييم النتائج، والتحسين التكراري» بشكل مستقل. يعتمد المشروع على إطار عمل smolagents الخاص بهم، ويوفر مدخلين: سطر الأوامر والواجهة الإلكترونية، والكود مفتوح على GitHub. أدوات ml-intern مبنية حول نظام بيئي لـ Hugging Face: البحث عن الأوراق على arXiv و HF Papers والتعمق في قراءتها عبر سلسلة الاستشهادات؛ تصفح مجموعات البيانات على HF Hub، والتحقق من جودتها ثم إعادة تنسيقها لإعادة استخدامها في التدريب؛ عند عدم توفر GPU محلي، يمكن استدعاء HF Jobs لبدء مهمة تدريب سحابي، وبعد الانتهاء من التدريب، يتم تلقائيًا قراءة مخرجات التقييم، وتشخيص أسباب الفشل، وإعادة التشغيل. بشكل افتراضي، يستخدم النظام Claude Sonnet 4.5 لدورة اتخاذ القرار، مع حد أقصى 300 تكرار، ويقوم بالضغط التلقائي عند تجاوز سياق أكثر من 170 ألف رمز. قدمت Hugging Face في منشورها ثلاثة أمثلة. في مهمة الاستنتاج العلمي، وجد الوكيل مجموعة بيانات OpenScience و NemoTron-CrossThink من سلسلة استشهادات الورقة المرجعية، ومررها عبر ARC و SciQ و MMLU مع تصفية حسب الصعوبة لانتقاء 7 نسخ مختلفة، وأجرى عليها 12 تكرار تدريب SFT على Qwen3-1.7B، وارتفعت درجة GPQA من 10% إلى 32%، واستغرقت أقل من 10 ساعات. في سيناريو الرعاية الصحية، قرر الوكيل أن جودة البيانات الحالية غير كافية، وكتب سكربتات لإنشاء 1100 بيانات تركيبية وتوسيعها 50 مرة للتدريب، متفوقًا على Codex بنسبة تزيد عن 60% على منصة HealthBench. في سيناريو المسابقات الرياضية، كتب الوكيل سكربت تدريب GRPO بنفسه وبدأ التدريب على A100 عبر HF Spaces، وراقب تراجع المكافأة، وأجرى تجارب إزالة العوامل لتحديد السبب. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت