Hugging Face відкриває ml-intern, агент з машинного навчання для автоматизованого читання статей, відбору даних та навчання

Згідно з моніторингом Dongcha Beating, Hugging Face відкрили вихідний код ml-intern, агент для досліджень у галузі машинного навчання, здатний автономно виконувати весь процес «читання статей, організації наборів даних, запуску тренувань на GPU, оцінки результатів та ітеративного покращення». Проєкт побудований на їхній власній платформі smolagents і пропонує як командний рядок (CLI), так і веб-інтерфейс, а код доступний на GitHub. Інструментарій ml-intern побудований навколо екосистеми Hugging Face: він отримує статті з arXiv та HF Papers і проводить глибоке читання уздовж ланцюгів цитувань; переглядає набори даних на HF Hub, перевіряє їхню якість, переформатовує їх і вводить для тренування; коли немає локального GPU, може викликати HF Jobs для запуску хмарних завдань тренування, автоматично читає результати оцінки, діагностує причини несправностей і перезапускає після завершення тренування. За замовчуванням він використовує Claude Sonnet 4.5 для керування циклом прийняття рішень, з максимумом 300 ітерацій за запуск і автоматичним стисненням контексту понад 170 тисяч токенів. Hugging Face надали три кейс-стаді у своєму реліз-пості. У задачі на наукове міркування агент визначив набори даних OpenScience і NemoTron-CrossThink із ланцюга цитувань бенчмаркової статті, відфільтрував сім варіантів з ARC, SciQ і MMLU за складністю і провів 12 раундів SFT на Qwen3-1.7B, підвищивши бал GPQA з 10% до 32% менш ніж за 10 годин. У медичному сценарії агент визначив, що якість існуючих наборів даних недостатня, і самостійно написав скрипт для генерації 1100 синтетичних точок даних, збільшивши набір даних у 50 разів для тренування, перевищивши Codex більш ніж на 60% на HealthBench. У сценарії з конкурентною математикою агент самостійно написав скрипт тренування GRPO і ініціював тренування на A100 через HF Spaces, спостерігаючи за колапсом винагороди та проводячи експерименти з абляцією для дослідження причин.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити