Hugging Face открывает исходный код ml-intern, агента по исследованию машинного обучения для автоматического чтения статей, выбора данных и обучения

Согласно мониторингу Dongcha Beating, Hugging Face выпустила в открытый доступ ml-intern, агент для исследований в области машинного обучения, способный самостоятельно выполнять весь процесс «чтения статей, организации наборов данных, запуска обучения на GPU, оценки результатов и итеративного улучшения». Проект построен на их собственной платформе smolagents и предлагает как командную строку, так и веб-интерфейс, а код доступен на GitHub. Инструментарий ml-intern построен вокруг экосистемы Hugging Face: он извлекает статьи из arXiv и HF Papers и осуществляет глубокое чтение по цепочкам цитирования; просматривает наборы данных на HF Hub, проверяет их качество, форматирует их и вводит для обучения; при отсутствии локального GPU может вызывать HF Jobs для запуска облачных задач обучения, автоматически читая выводы оценки, диагностируя причины сбоев и перезапуская обучение после завершения. По умолчанию он использует Claude Sonnet 4.5 для управления циклом принятия решений, с максимумом 300 итераций за запуск и автоматическим сжатием контекста, превышающего 170 тысяч токенов. Hugging Face предоставила три примера использования в своем релизном посте. В задаче научного рассуждения агент выявил датасеты OpenScience и NemoTron-CrossThink из цепочки цитирования эталонной статьи, отфильтровал семь вариантов из ARC, SciQ и MMLU по сложности и провел 12 раундов обучения с Qwen3-1.7B, повысив оценку GPQA с 10% до 32% менее чем за 10 часов. В медицинском сценарии агент определил, что качество существующих наборов данных недостаточно, и самостоятельно написал скрипт для генерации 1100 синтетических данных, увеличив набор данных в 50 раз для обучения, превзойдя Codex более чем на 60% по HealthBench. В сценарии конкурентной математики агент самостоятельно написал скрипт обучения GRPO и запустил обучение на A100 через HF Spaces, наблюдая за коллапсом вознаграждения и проводя эксперименты по абляции для выяснения причины.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить