Môi trường trí tuệ tự tiến hóa mã nguồn mở Prime Intellect: cho phép AI "đấu tranh lẫn nhau" tạo ra hơn 8000 công cụ kiểm thử

AIMPACT Tin nhắn, ngày 19 tháng 5 (UTC+8), theo theo dõi Beating của Dongcha, Prime Intellect công bố môi trường huấn luyện trí thông minh mở nguồn general-agent, đây là một môi trường tổng hợp có thể tự tiến hóa. Việc phát hành lần này tập trung vào việc đặt nhiệm vụ thành một trò chơi đối kháng hai người: do bộ sinh và bộ giải lần lượt cạnh tranh, hiện đã tự động xây dựng một cơ sở dữ liệu trạng thái lớn gồm 4504 nhiệm vụ và hơn 8000 công cụ độc đáo. Môi trường này bắt đầu từ các nhiệm vụ hạt giống đơn giản, qua 9 chiến lược như ràng buộc điều kiện, lệnh nhiễu, liên kết giữa các thực thể, chia nhiệm vụ thành năm cấp độ độ khó từ t0 đến t4. Bộ sinh chịu trách nhiệm thiết kế nhiệm vụ có cơ sở dữ liệu, công cụ tương tác và hàm xác minh, trong khi bộ giải cố gắng vượt qua thử thách. Chỉ những nhiệm vụ có tỷ lệ thành công nằm trong phạm vi độ khó nhất định mới được giữ lại, cấp độ khó nhất sẽ trở thành hạt giống cho vòng tiến hóa tiếp theo. Thử nghiệm chính thức cho thấy, chỉ với hơn 4400 đoạn đường dẫn được tổng hợp từ môi trường này để tinh chỉnh mô hình 30B tham số, đã nâng tỷ lệ chính xác gọi công cụ trong bài kiểm tra chuẩn BFCL từ 18.9% lên 52.3%. Cơ chế này giúp mô hình thoát khỏi sự phụ thuộc vào tập dữ liệu tĩnh do con người gán nhãn. Thông qua trò chơi trực tiếp giữa các mô hình, hệ thống có thể liên tục tự động tạo ra dữ liệu huấn luyện có thể kiểm soát độ khó và có xác thực ngữ nghĩa. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim