Hugging Face відкритий ml-intern, автоматичне читання статей, вибір даних, запуск тренувань — агент з досліджень машинного навчання

robot
Генерація анотацій у процесі
ME News Новини, 22 квітня (UTC+8), згідно з моніторингом Датчі Beating, Hugging Face відкрила вихідний код ml-intern, агент для досліджень машинного навчання, який може самостійно виконувати повний цикл «читання статей, обробки датасетів, запуску GPU-навчання, оцінки результатів, ітеративного покращення». Проєкт побудований на власній рамці smolagents, пропонує два входи: CLI та веб-інтерфейс, код відкритий на GitHub. Інструментарій ml-intern побудований навколо екосистеми Hugging Face: пошук статей на arXiv та HF Papers з глибоким аналізом за цитатним ланцюгом; перегляд датасетів на HF Hub, перевірка якості, повторне форматування та повторне використання для тренування; при відсутності GPU локально можна викликати HF Jobs для запуску хмарних завдань тренування, після завершення автоматично зчитувати результати оцінки, діагностувати причини невдачі та перезапускати. За замовчуванням використовує Claude Sonnet 4.5 для керування циклом прийняття рішень, максимум 300 ітерацій за один запуск, автоматичне стиснення контексту понад 170 тисяч токенів. Hugging Face у своєму пості навів три приклади. У задачах на наукове логічне мислення агент знаходить датасети OpenScience та NemoTron-CrossThink у цитатних ланцюгах базових статей, відфільтровує 7 варіантів за складністю з ARC, SciQ, MMLU, запускає 12 раундів SFT на Qwen3-1.7B, score GPQA зростає з 10% до 32%, час менше 10 годин. У медичних сценаріях агент визначає, що існуючі датасети недостатньої якості, самостійно генерує скриптами 1100 синтетичних даних та збільшує їх у 50 разів для тренування, перевищуючи 60% у HealthBench порівняно з Codex. У математичних змаганнях агент самостійно пише скрипти для тренування GRPO та запускає їх на A100 через HF Spaces, після чого при зниженні нагороди проводить аналіз причин за допомогою абляційних експериментів. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено