Hugging Face开源ml-intern,自动读论文、选数据、跑训练的ML研究代理

robot
摘要生成中
ME News 消息,4 月 22 日(UTC+8),据 动察 Beating 监测,Hugging Face 开源 ml-intern,一个能自主完成「读论文、整理数据集、启动 GPU 训练、评估结果、迭代改进」全流程的 ML 研究代理。项目基于自家 smolagents 框架构建,提供 CLI 和网页端两种入口,代码在 GitHub 开源。 ml-intern 的工具链围绕 Hugging Face 生态搭建:在 arXiv 和 HF Papers 上检索论文并沿引用链深读;浏览 HF Hub 上的数据集,检查质量后重新格式化再投入训练;本地没有 GPU 时可调用 HF Jobs 启动云端训练任务,训练结束后自动读取评估输出、诊断失败原因并重跑。默认调用 Claude Sonnet 4.5 驱动决策循环,单次最多迭代 300 轮,上下文超过 170k token 自动压缩。 Hugging Face 在发布帖中给出三个案例。科学推理任务中,代理从基准论文的引用链里找到 OpenScience 和 NemoTron-CrossThink 数据集,从 ARC、SciQ、MMLU 中按难度过滤出 7 个变体,在 Qwen3-1.7B 上跑了 12 轮 SFT,GPQA 得分从 10% 提到 32%,耗时不到 10 小时。医疗场景中,代理判断现有数据集质量不够,自行编写脚本生成 1100 条合成数据并扩增 50 倍用于训练,在 HealthBench 上超过 Codex 60%。竞赛数学场景中,代理自行编写 GRPO 训练脚本并在 A100 上通过 HF Spaces 启动训练,观测到奖励塌缩后跑消融实验排查原因。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论