Các nhà nghiên cứu đề xuất công nghệ DPN-LE: có thể chỉnh sửa trực tiếp "nhân tố thần kinh cá nhân" của mô hình lớn, đạt được kiểm soát chi tiết về tính cách AI

robot
Đang tạo bản tóm tắt

BlockBeats Tin tức, ngày 3 tháng 5, nhà nghiên cứu AI Brian Roemmele tiết lộ rằng công ty “Zero-Human Company” của ông đã bắt đầu triển khai công nghệ chỉnh sửa nhân cách mô hình lớn có tên DPN-LE (Dual Personality Neuron Localization and Editing), dùng để điều chỉnh chính xác đặc điểm hành vi của AI Agent.

Theo giới thiệu, DPN-LE thông qua định vị “neuron nhân cách” trong các lớp MLP của mô hình lớn, có thể tăng cường hoặc giảm bớt các đặc điểm như “trung thực, sáng tạo, cẩn trọng, hợp tác”. Nghiên cứu cho biết, phương pháp này chỉ cần chỉnh sửa khoảng 0,5% neuron, mà không cần huấn luyện lại mô hình, để thực hiện các điều chỉnh “phẫu thuật” về tính cách AI, đồng thời cố gắng tránh làm tổn hại khả năng suy luận cốt lõi.

Roemmele cho biết, công ty của ông hiện có hơn 100 AI Agent, hoạt động hàng ngày gần như hoàn toàn tự động, do đó “tính nhất quán nhân cách” trở thành vấn đề then chốt. Ví dụ:

Các Agent chiến lược sẽ tăng cường “tính nhất quán dài hạn” và “trung thực phân tích”
Các Agent tài chính và quản lý rủi ro sẽ tăng cường “cẩn trọng” và “chính xác”
Các Agent nội dung sẽ nâng cao “khả năng đồng cảm” và “sáng tạo”
Lớp hợp tác đa Agent sẽ tăng cường “hợp tác”

Ông nói rằng, do DPN-LE thuộc giai đoạn suy luận, việc chỉnh sửa nhẹ nhàng, công ty có thể trong vài phút “tái tạo nhân cách” hàng loạt và triển khai nhiều AI Agent, giảm đáng kể chi phí phù hợp AI (Alignment). Thị trường cho rằng, công nghệ “chương trình nhân cách” này có nghĩa là AI Agent đang tiến từ cạnh tranh về khả năng đơn thuần, tiến xa hơn đến kiểm soát hành vi và quản trị tổ chức.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim