Các nhà nghiên cứu giới thiệu công nghệ DPN-LE: Chỉnh sửa trực tiếp các "neuron cá tính" của mô hình lớn để kiểm soát nhân vật AI tinh chỉnh

robot
Đang tạo bản tóm tắt

Vào ngày 3 tháng 5, nhà nghiên cứu AI Brian Roemmele tiết lộ rằng ‘Công ty Không Người’ của ông đã bắt đầu triển khai công nghệ chỉnh sửa tính cách mô hình lớn gọi là DPN-LE (Định vị và Chỉnh sửa Neuron Tính cách Song song) để điều chỉnh chính xác các đặc điểm hành vi của các Tác nhân AI. Theo giới thiệu, DPN-LE xác định ‘neuron tính cách’ trong các lớp MLP của các mô hình lớn, cho phép tăng cường hoặc làm yếu các đặc điểm như ‘chân thành, sáng tạo, thận trọng và hợp tác.’ Nghiên cứu cho rằng phương pháp này chỉ cần chỉnh sửa khoảng 0,5% neuron để đạt được các điều chỉnh ‘phẫu thuật’ đối với tính cách AI mà không cần huấn luyện lại mô hình, đồng thời giảm thiểu thiệt hại đối với khả năng lý luận cốt lõi. Roemmele cho biết công ty của ông hiện có hơn 100 Tác nhân AI, hoạt động hàng ngày gần như hoàn toàn tự động, khiến ‘tính nhất quán tính cách’ trở thành vấn đề then chốt. Ví dụ, các Tác nhân chiến lược sẽ nâng cao ‘tính nhất quán dài hạn’ và ‘chính trực phân tích,’ các Tác nhân kiểm soát tài chính và rủi ro sẽ củng cố ‘thận trọng’ và ‘chính xác,’ các Tác nhân liên quan đến nội dung sẽ cải thiện ‘đồng cảm’ và ‘sáng tạo,’ và các lớp hợp tác đa Tác nhân sẽ nâng cao ‘hợp tác.’ Ông lưu ý rằng vì DPN-LE liên quan đến các chỉnh sửa nhẹ trong giai đoạn suy luận, công ty có thể ‘tạo hình lại tính cách’ hàng loạt và triển khai nhiều Tác nhân AI trong vòng vài phút, giảm đáng kể chi phí phù hợp AI. Thị trường xem công nghệ ‘tính cách lập trình được’ này như một bước chuyển từ cạnh tranh về khả năng đơn thuần giữa các Tác nhân AI sang cạnh tranh về kiểm soát hành vi và quản trị tổ chức.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim