Hugging Face открытый исходный код ml-intern, автоматический агент для чтения статей, выбора данных и запуска обучения в ML-исследованиях

robot
Генерация тезисов в процессе
ME News Новости, 22 апреля (UTC+8), согласно мониторингу 动察 Beating, Hugging Face выпустила ml-intern — открытый агент для ML-исследований, способный самостоятельно выполнять весь цикл: «чтение статей, подготовка датасетов, запуск GPU-обучения, оценка результатов, итеративное улучшение». Проект основан на собственной рамке smolagents, предоставляет интерфейсы CLI и веб-версию, код открыт на GitHub. Инструментарий ml-intern построен вокруг экосистемы Hugging Face: ищет статьи на arXiv и HF Papers, глубоко изучает по цепочке цитирования; просматривает датасеты на HF Hub, проверяет качество, форматирует и использует для обучения; при отсутствии локального GPU вызывает HF Jobs для запуска облачного обучения, после завершения автоматически читает вывод оценки, диагностирует причины ошибок и перезапускает. По умолчанию использует Claude Sonnet 4.5 для управления циклом принятия решений, максимум 300 итераций за раз, при превышении контекста 170k токенов автоматически сжимает. Hugging Face в своем посте привела три примера. В задаче научного рассуждения агент находит датасеты OpenScience и NemoTron-CrossThink через цепочку цитирования базовой статьи, фильтрует 7 вариантов по сложности из ARC, SciQ, MMLU, обучает 12 эпох на Qwen3-1.7B, результат GPQA вырос с 10% до 32%, затратив менее 10 часов. В медицинском сценарии агент определяет, что существующие датасеты недостаточного качества, самостоятельно пишет скрипты для генерации 1100 синтетических данных, увеличивая их в 50 раз для обучения, достигая более 60% на HealthBench по сравнению с Codex. В математическом соревновании агент самостоятельно пишет скрипты для обучения GRPO и запускает обучение на A100 через HF Spaces, после снижения награды проводит абляционные эксперименты для выявления причин. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено