Hugging Face mã nguồn mở ml-intern, tự động đọc bài báo, chọn dữ liệu, chạy huấn luyện, đại lý nghiên cứu ML

robot
Đang tạo bản tóm tắt
Tin tức ME News, ngày 22 tháng 4 (UTC+8), theo theo dõi của Động Chấn Beating, Hugging Face đã mở mã nguồn ml-intern, một đại lý nghiên cứu ML có thể tự thực hiện toàn bộ quy trình 「đọc bài báo, tổ chức dữ liệu, khởi động huấn luyện GPU, đánh giá kết quả, cải tiến lặp lại」. Dự án dựa trên khung framework smolagents của chính họ, cung cấp hai cổng vào CLI và web, mã nguồn mở trên GitHub. Công cụ của ml-intern xây dựng quanh hệ sinh thái Hugging Face: truy xuất bài báo trên arXiv và HF Papers rồi đọc sâu theo chuỗi trích dẫn; duyệt qua bộ dữ liệu trên HF Hub, kiểm tra chất lượng rồi định dạng lại để huấn luyện; khi không có GPU tại chỗ, có thể gọi HF Jobs để khởi động nhiệm vụ huấn luyện đám mây, sau khi huấn luyện xong tự động đọc kết quả đánh giá, chẩn đoán nguyên nhân thất bại và chạy lại. Mặc định sử dụng Claude Sonnet 4.5 để điều khiển vòng lặp quyết định, tối đa 300 vòng lặp mỗi lần, ngữ cảnh vượt quá 170k token sẽ tự động nén. Hugging Face trong bài đăng công bố đưa ra ba ví dụ. Trong nhiệm vụ suy luận khoa học, đại lý tìm ra bộ dữ liệu OpenScience và NemoTron-CrossThink trong chuỗi trích dẫn của bài báo chuẩn, lọc ra 7 biến thể theo độ khó từ ARC, SciQ, MMLU, chạy 12 vòng SFT trên Qwen3-1.7B, điểm GPQA từ 10% lên 32%, tiêu tốn chưa đến 10 giờ. Trong cảnh y tế, đại lý đánh giá chất lượng bộ dữ liệu hiện có không đủ, tự viết script tạo ra 1100 dữ liệu tổng hợp và mở rộng gấp 50 lần để huấn luyện, trên HealthBench vượt quá Codex 60%. Trong cảnh toán thi đấu, đại lý tự viết script huấn luyện GRPO và khởi động huấn luyện trên A100 qua HF Spaces, quan sát thấy phần thưởng bị sụp đổ rồi chạy thử nghiệm loại bỏ để điều tra nguyên nhân. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim