Chỉ mã cứng đối đầu trực tiếp với mạng nơ-ron! Mô hình lớn viết tay kiểm soát quy tắc xâm nhập vào ngành công nghiệp cứng, 14 đô la chạy trọn bộ chiến lược

robot
Đang tạo bản tóm tắt
AIMPACT Tin nhắn, ngày 19 tháng 5 (UTC+8), theo theo dõi của Beating, các thành viên cốt lõi sau đào tạo của OpenAI, ông Ông Gia Dực vừa chứng minh rằng "chỉ dựa vào mô hình lớn để viết mã có thể vượt qua trò chơi Atari", các nhà nghiên cứu Paul Garnier đã mang phương pháp này vào điều khiển chất lỏng phức tạp hơn.
Anh ấy hoàn toàn không huấn luyện bất kỳ mạng nơ-ron nào.
Chỉ đơn giản để Codex 5.5 đóng vai trò như lập trình viên, nhìn chằm chằm vào video mô phỏng chất lỏng để chỉnh sửa lại các script Python nhiều lần.
Chỉ dựa vào bộ quy tắc điều khiển thủ công này, AI đã vượt qua hơn một nửa các thử nghiệm vật lý, thậm chí còn đánh bại các mô hình dựa trên học tăng cường (DRL) hàng đầu trong nhiều cảnh khác nhau.
Giảm trở lực cho ô tô, làm dịu dòng chảy rối trong ống dẫn, ngành công nghiệp trước đây chỉ có thể dựa vào sức mạnh tính toán để "bơm" ra một mô hình hộp đen khó hiểu để điều khiển van khí động học.
Codex đã tránh khỏi con đường chết đó.
Các quy tắc do nó viết ra cực kỳ rõ ràng, ví dụ như "khi độ cong cục bộ quá lớn, trì hoãn phun khí".
Vài chục dòng mã ngắn mang kiến thức vật lý, trực tiếp thay thế việc thử sai bạo lực của mạng nơ-ron một cách mù quáng.
Thay thế hộp đen bằng mã, loại bỏ điểm yếu cố định của mạng nơ-ron dễ vỡ khi va chạm.
Trước đây, chỉ cần phần cứng thay đổi chút xíu (ví dụ như thay đổi số lượng vòi phun từ 5 thành 10), mô hình cũ sẽ bị loại bỏ ngay lập tức, phải tốn tiền đào tạo lại.
Giờ chỉ cần chỉnh một hằng số trong mã, hệ thống có thể kết nối với thiết bị mới ngay lập tức.
Khi thời gian thử nghiệm bị kéo dài gấp bốn lần, các mô hình DRL truyền thống vượt khỏi vùng kinh nghiệm hoàn toàn sụp đổ;
nhưng mã do mô hình lớn viết ra, vì tuân theo logic vật lý trực tiếp, luôn vận hành ổn định.
Việc chạy toàn bộ chiến lược điều khiển này, mô hình lớn chỉ tiêu tốn 21,25 triệu token, tổng chi phí chưa đến 14 đô la.
(Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim