Bạn có nhận thấy trong năm qua, các tuyên bố về việc chúng ta đã đạt được trí tuệ nhân tạo chung (AGI) ngày càng trở nên lớn tiếng hơn không? Mới đây, trên tạp chí Nature, xu hướng này còn được đẩy lên cao hơn nữa. Tuy nhiên, có một vấn đề nền tảng mà nhiều người bỏ qua.



Vấn đề ở đây là: mọi người nhầm lẫn hai khái niệm hoàn toàn khác nhau. Một mặt, chúng ta có các mô hình ngôn ngữ thể hiện kết quả ấn tượng trong các bài kiểm tra và xử lý nhiều nhiệm vụ đa dạng. Mặt khác, điều này hoàn toàn không có nghĩa là chúng ta đã tạo ra trí tuệ chung thực sự. Đây chính là sự pha trộn giữa việc nhận dạng mẫu ngày càng phức tạp và trí tuệ thật sự.

Nếu xem các định nghĩa lịch sử về AGI, luôn nhấn mạnh các yếu tố khác: độ tin cậy trong các ngữ cảnh khác nhau, khả năng tổng quát hóa khi đối mặt với điều mới lạ, sự linh hoạt. Không chỉ đơn thuần là điểm số cao trong các bài kiểm tra trong điều kiện nhân tạo.

Điều thú vị là các nghiên cứu gần đây cho thấy, các hệ thống giải quyết tốt các bài kiểm tra thường gặp phải vấn đề khi điều kiện thay đổi nhỏ. Ví dụ, các mô hình y học có thể đưa ra câu trả lời đúng ngay cả khi thiếu dữ liệu quan trọng, nhưng lại trở nên không ổn định khi phân phối dữ liệu có chút thay đổi. Đây không phải là trí tuệ, mà là huấn luyện theo các kịch bản cụ thể.

Ở cấp độ kinh tế, bức tranh còn rõ nét hơn nữa. Ngay cả các hệ thống tiên tiến nhất cũng chỉ có thể thực hiện một phần nhỏ các nhiệm vụ thực tế một cách đáng tin cậy, mặc dù đạt điểm cao trong các điều kiện kiểm thử. Các dữ liệu gần đây cho thấy phần lớn các công ty vẫn chưa thấy lợi ích rõ ràng từ việc triển khai AI. Điều này không giống như trí tuệ chung.

Còn một điểm nữa thường bị bỏ qua. Khi các mô hình ngôn ngữ và con người đưa ra câu trả lời giống nhau, điều đó không có nghĩa là họ suy nghĩ giống nhau. Tôi đã thấy các ví dụ, trong đó mô hình đưa ra kết luận tự tin trong tình huống không rõ ràng, trong khi chuyên gia lại do dự vì thiếu thông tin. Sự trùng hợp bề ngoài che giấu những khác biệt sâu sắc trong quá trình suy nghĩ.

Các hệ thống hiện tại vẫn còn mong manh. Chúng phụ thuộc vào cách đặt câu hỏi, không có mục tiêu bền vững, không thể suy nghĩ một cách đáng tin cậy trong dài hạn. Ngay cả các câu chuyện về việc các mô hình giải quyết các bài toán toán học mở cũng chủ yếu là sự kết hợp và thử các phương pháp đã có, chứ không phải là sáng tạo ra chiến lược mới.

Vấn đề không chỉ nằm ở thuật ngữ. Khi các hệ thống này bắt đầu được tích hợp vào các quy trình ra quyết định trong khoa học và các cơ quan nhà nước, việc đánh giá quá cao khả năng của chúng có thể dẫn đến những sai lầm nghiêm trọng trong phân bổ niềm tin và trách nhiệm. Do đó, việc pha trộn giữa việc sử dụng các phương pháp thống kê nâng cao với trí tuệ chung không chỉ là một lỗi về mặt khái niệm mà còn mang theo rủi ro thực tế.

Các mô hình mà chúng ta có hiện nay là những công cụ mạnh mẽ, đúng vậy. Nhưng chúng vẫn chỉ là công cụ, chứ không phải là các tác nhân có năng lực linh hoạt thực sự. Sự khác biệt này rất quan trọng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Ghim