Plurai:Mô hình nhỏ 30 tỷ tham số vượt qua mô hình bảo vệ chuyên dụng 200 tỷ

robot
Đang tạo bản tóm tắt

Tin tức từ Coinjie.com, khung cảnh barred do Plurai đề xuất, thông qua việc cung cấp mô tả nhiệm vụ và một số mẫu không gắn nhãn nhỏ, tự động tạo ra dữ liệu huấn luyện tổng hợp, huấn luyện ra các hàng rào bảo vệ nội dung tùy chỉnh (guardrail), dùng để kiểm tra xem đầu ra của AI có vi phạm hay không. Việc tinh chỉnh mô hình qwen2.5-3b (30 tỷ tham số) dựa trên bộ dữ liệu này đã vượt xa OpenAI’s oss-safeguard-20b (200 tỷ tham số) trong các nhiệm vụ như chiến lược đối thoại, kiểm tra đầu ra của agent và tuân thủ y tế, và cũng vượt qua GPT-4.1 trực tiếp sử dụng. Khung này phân chia nhiệm vụ thành nhiều chiều, đặc biệt tạo ra các mẫu dễ bị phân biệt sai ở vùng biên giới. Sau khi tạo ra, cần qua bước 「 tranh luận không đối xứng」 để đảm bảo độ chính xác của nhãn mẫu. Mã đánh giá và bộ dữ liệu đã được mở nguồn trên GitHub và Hugging Face.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim