Hugging Face Mở nguồn ml-intern, một Trợ lý Nghiên cứu ML cho Đọc bài báo tự động, Lựa chọn dữ liệu và Đào tạo

Theo giám sát của Dongcha Beating, Hugging Face đã mở mã nguồn ml-intern, một tác nhân nghiên cứu ML có khả năng tự động hoàn thành toàn bộ quá trình “đọc bài báo, tổ chức dữ liệu, khởi động đào tạo GPU, đánh giá kết quả và lặp lại cải tiến.” Dự án được xây dựng dựa trên framework smolagents của chính họ và cung cấp cả truy cập CLI lẫn dựa trên web, với mã nguồn có sẵn trên GitHub. Chuỗi công cụ của ml-intern được xây dựng xung quanh hệ sinh thái Hugging Face: nó lấy bài báo từ arXiv và HF Papers và thực hiện đọc sâu theo chuỗi trích dẫn; nó duyệt qua các bộ dữ liệu trên HF Hub, kiểm tra chất lượng, định dạng lại chúng, rồi đưa vào đào tạo; khi không có GPU cục bộ, nó có thể gọi HF Jobs để khởi động các tác vụ đào tạo đám mây, tự động đọc kết quả đánh giá, chẩn đoán nguyên nhân thất bại, và chạy lại sau khi đào tạo hoàn tất. Theo mặc định, nó sử dụng Claude Sonnet 4.5 để điều khiển vòng quyết định, với tối đa 300 vòng lặp mỗi lần chạy và tự động nén ngữ cảnh vượt quá 170 nghìn token. Hugging Face cung cấp ba nghiên cứu điển hình trong bài đăng ra mắt của họ. Trong một nhiệm vụ lý luận khoa học, tác nhân xác định các bộ dữ liệu OpenScience và NemoTron-CrossThink từ chuỗi trích dẫn của một bài báo chuẩn, lọc ra bảy biến thể từ ARC, SciQ và MMLU dựa trên độ khó, và chạy 12 vòng SFT trên Qwen3-1.7B, nâng điểm GPQA từ 10% lên 32% trong chưa đầy 10 giờ. Trong một tình huống y học, tác nhân xác định rằng chất lượng của các bộ dữ liệu hiện có không đủ và tự động viết một script để tạo ra 1.100 điểm dữ liệu tổng hợp, mở rộng bộ dữ liệu gấp 50 lần để đào tạo, vượt qua Codex hơn 60% trên HealthBench. Trong một tình huống toán học cạnh tranh, tác nhân tự viết script đào tạo GRPO và khởi động đào tạo trên A100 qua HF Spaces, quan sát sự sụp đổ phần thưởng và tiến hành các thí nghiệm loại bỏ để điều tra nguyên nhân.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim