Prime Intellect mở nền tảng Lab: Huấn luyện hậu của Agent trở thành vòng kín, tính phí theo token không theo thời gian GPU

robot
Đang tạo bản tóm tắt

Thông tin từ Coin界.net, Prime Intellect thông báo nền tảng huấn luyện Agent hậu của họ, Lab, đã chuyển từ giai đoạn beta sang phiên bản chính thức. Nền tảng này tích hợp đánh giá, huấn luyện học tăng cường (RL), triển khai bộ điều hợp và suy luận thành một vòng khép kín, người dùng có thể định nghĩa nhiệm vụ và tiêu chuẩn đánh giá, nền tảng tự động điều khiển mô hình thử sai lặp đi lặp lại trong nhiệm vụ, thu thập tín hiệu thưởng và huấn luyện bộ điều hợp Lora. Việc huấn luyện tính phí theo token chứ không theo thời gian GPU, dựa trên khung công tác Prime-RL mã nguồn mở của công ty. Lab hỗ trợ lần đầu 14 mô hình của Nvidia, OpenAI, Meta và Qwen, với tham số từ 1B đến 70B, bao gồm kiến trúc đặc và MOE. Prime Intellect thành lập năm 2023, huy động tổng cộng hơn 70 triệu USD, vòng gọi vốn Series A do Founders Fund dẫn đầu, vòng B do Radical Ventures dẫn đầu.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim