Đối tác YC: Thay vì cạnh tranh về kích thước mô hình, hãy để AI tự tiến hóa như các nhà khoa học viết mã.

robot
Đang tạo bản tóm tắt

Theo giám sát Beating, đối tác của Y Combinator Diana Hu đã chỉ ra trên X rằng, so với việc mở rộng quy mô tham số đơn thuần, tương lai của lĩnh vực tiên phong nằm ở việc xây dựng lớp phần mềm mỏng dựa trên mô hình nền tảng, cho phép AI tự viết ra các quy tắc giải quyết vấn đề như lập trình viên (mô hình thế giới có thể thực thi). AI có thể liên tục thử nghiệm, chỉnh sửa và tối giản mã dựa trên kết quả chạy, mà không cần phải tinh chỉnh tốn kém của mô hình lớn.

Con đường học mã không gradient đã chứng thực cho mô hình học theo kiểu hướng dẫn (Heuristic Learning) mà các thành viên cốt lõi của OpenAI, ông Weng Jiayi, đã đề xuất vào tháng trước. Để dạy AI làm quen một nhiệm vụ, phương pháp truyền thống của học tăng cường cần hàng nghìn lần thử nghiệm, ép buộc kinh nghiệm vào hộp đen của mạng nơ-ron, tiêu tốn năng lượng lớn và dễ quên. Trong khi đó, thí nghiệm của Weng Jiayi cho thấy, mà không cần điều chỉnh bất kỳ tham số nào của mô hình lớn, chỉ dựa vào chính mô hình lớn tự viết mã Python, tìm lỗi và điều chỉnh quy tắc, đã giúp nó vượt qua trò chơi Atari Breakout. Điều này cho thấy, phương tiện chứa kiến thức hoàn toàn có thể là hệ thống mã dễ đọc, dễ kiểm thử của con người, chứ không phải là trọng số của mạng nơ-ron không thể hiểu nổi.

Theo Paul Graham, đồng sáng lập của YC, vòng lặp viết mã, xác nhận và nén rất gần với hoạt động nghiên cứu hàng ngày của nhà khoa học. Mô hình lớn không cần phải tái cấu trúc bộ não, mà giống như nhà khoa học, dùng mã viết giả thuyết về môi trường mới, chạy mã để xác thực các thí nghiệm, và trích xuất các quy tắc đơn giản nhất để giải quyết vấn đề. Quá trình tìm kiếm chương trình tối giản nhất cũng chính là tiêu chuẩn cuối cùng để đánh giá hiệu quả trí tuệ nhân tạo của ARC-AGI.

Điều lợi ích then chốt là, học mã không gradient có thể tận dụng lợi thế từ khả năng nâng cao của mô hình lớn nền tảng. Khi mô hình lớn trở nên thông minh hơn, các chiến lược và mã do AI viết ra sẽ trở nên mạnh mẽ gấp bội. Trên nền tảng bài học đắng cay của Richard Sutton về "Bài học đắng" (The Bitter Lesson), học mã không gradient đang vẽ ra một đường cong hình chữ S hoàn toàn mới. Với sự bùng nổ khả năng mã của mô hình lớn, con đường tự tiến hóa của AI đang mở ra chương mới của mô hình trí tuệ nhân tạo thế hệ tiếp theo.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim