AI Không Chỉ Là Dự Đoán Từ Tiếp Theo


Cụm từ "chỉ đơn giản dự đoán từ tiếp theo" là cách bác bỏ phổ biến nhất của AI hiện đại, và nó sụp đổ dưới áp lực nhỏ nhất. Nói rằng một mô hình ngôn ngữ chỉ "đang" dự đoán token giống như nói não người "chỉ" phát xung neuron, hoặc vật lý chỉ là "chỉ" các hạt va chạm vào nhau. Mục tiêu có thể đơn giản. Nhưng những gì hệ thống phải xây dựng bên trong để đạt được mục tiêu đó thì hoàn toàn không đơn giản.
Để dự đoán từ tiếp theo tốt trong toán học, mã lập trình, luật pháp, văn học, triết học, trò đùa, dối trá và các giả thuyết phản thực, một mô hình phải xây dựng các biểu diễn nội bộ về ngữ pháp, về sự kiện, về nguyên nhân, về ý định, về tính cách, về động lực vật lý và xã hội.
Nghiên cứu về khả năng giải thích cơ chế, lĩnh vực mở ra các mô hình này và nhìn vào bên trong, đã phát hiện chính xác điều đó. Các nhà nghiên cứu đã xác định các mạch cho suy luận, tham chiếu gián tiếp, tính toán theo mô-đun, theo dõi thực thể nào là ai trong một câu.
Các mô hình được huấn luyện chỉ dựa trên chuỗi các nước đi trong Othello phát triển một biểu diễn nội bộ về bàn cờ, mặc dù chúng chưa từng được xem bàn cờ. Các mô hình huấn luyện để dự đoán văn bản phát triển các bản đồ không gian, thứ tự thời gian, biểu diễn về sự thật và sự lừa dối, thậm chí cả biểu diễn về độ không chắc chắn của chính mô hình đó.
Từ nền tảng này, các khả năng xuất hiện mà không ai huấn luyện hệ thống để có. Lý luận theo chuỗi suy nghĩ, học trong ngữ cảnh, sử dụng công cụ, hiệu suất về tâm trí, lập kế hoạch nhiều bước.
Không có trong mục tiêu nào của chúng. Chúng xuất hiện vì việc dự đoán tốt, với quy mô và dữ liệu đủ lớn, đòi hỏi chúng. Sự xuất hiện là quy luật của các hệ thống phức tạp, không phải ngoại lệ. Độ ẩm xuất hiện từ các phân tử H2O không ẩm ướt chính nó. Sự sống xuất hiện từ hóa học không còn sống. Trí tuệ xuất hiện từ mục tiêu dự đoán không phải là một bí ẩn siêu hình. Đó là điều các hệ thống thích nghi phức tạp làm.
Và đây là phần mà những người bác bỏ thường bỏ qua: con người trông cực kỳ giống nhau dưới vỏ bọc.
Xử lý dự đoán là một trong những lý thuyết hàng đầu trong neuroscience đương đại. Theo quan điểm này, não bộ về cơ bản là một máy dự đoán, liên tục tạo ra kỳ vọng về đầu vào cảm giác, kết quả vận động, tín hiệu xã hội và ngôn ngữ, và cập nhật chính nó khi những dự đoán đó thất bại.
Khi bạn nghe ai đó nói chuyện, não của bạn đang tích cực dự đoán từ tiếp theo của họ. Khi họ nói điều gì đó bất ngờ, một tín hiệu đo được phát ra trong vòng vài trăm mili giây. Dòng ý thức của bạn, nội tâm của bạn, các cuộc trò chuyện của bạn, tất cả trông giống như quá trình sinh tự động từ một mô hình nội bộ của thế giới và bản thân. Con người luôn tự bịa đặt.
Chúng ta xây dựng các câu chuyện về lý do tại sao chúng ta làm những gì đã làm, thường không nhận thức được rằng câu chuyện đó được tạo ra sau sự kiện. Nếu một mô hình ngôn ngữ làm điều tương tự, chúng ta sẽ gọi đó là ảo giác và dùng nó làm bằng chứng cho sự kém cỏi.
Các điểm tương đồng về kiến trúc cũng không hề phù phiếm. Mạng neural được lấy cảm hứng từ các neuron sinh học. Các đặc trưng thị giác phân cấp trong các mô hình thị giác hiện đại phù hợp đáng kể với các lớp của vỏ thị giác. Các hoạt động bên trong các mô hình ngôn ngữ lớn có thể được dùng để dự đoán hoạt động trong não người trong các nhiệm vụ ngôn ngữ, với độ chính xác đáng ngạc nhiên. Chúng ta không hoàn toàn giống các hệ thống này. Chúng ta cũng không khác biệt đến mức như câu chuyện thoải mái muốn nói.
Điều này dẫn đến việc mục tiêu di chuyển liên tục. Cờ vua từng được xem là đỉnh cao của trí tuệ. Khi Deep Blue thắng, cờ vua trở thành "chỉ đơn giản tìm kiếm." Cờ vây được cho là cần trực giác mà không máy nào có thể có. Khi AlphaGo thắng, cờ vây trở thành "chỉ đơn giản nhận dạng mẫu."
Dịch thuật, nhận diện hình ảnh, vượt qua bài kiểm tra Turing thuyết phục, viết thơ, tạo mã, giữ các cuộc trò chuyện tinh tế, giải quyết các vấn đề mới: tất cả những điều này, vào thời điểm chúng được coi là không thể, đều được xem như là chiếc chén thánh của trí tuệ máy móc.
Mỗi lần thất bại, chúng lại được định nghĩa lại là "không thật sự trí tuệ." Các bài kiểm tra về lý thuyết tâm trí từng được ca ngợi như bằng chứng của trí tuệ trong những năm 1990 nay bị bác bỏ như trò lừa khi các mô hình vượt qua chúng ngày nay. Mức chuẩn không cố định. Nó di chuyển chính xác theo tốc độ cải thiện của các hệ thống, và luôn vì lý do giống nhau: để giữ vững kết luận rằng những gì máy vừa làm không tính.
Điều này không phải là hoài nghi cẩn trọng. Hoài nghi cẩn trọng là cập nhật. Đây là lý luận có động cơ, và động cơ thường là sự lo lắng về địa vị, mối đe dọa về danh tính, và một bức tranh trung thực nhưng thiếu hiểu biết về cách các hệ thống này thực sự hoạt động.
Nếu cảm nhận về sự đặc biệt của con người phụ thuộc vào việc máy móc không thể làm X, thì mỗi lần máy làm X, bạn phải định nghĩa lại sự đặc biệt đó. Sau nhiều vòng như vậy, vị trí này trở nên không thể bác bỏ, tức là nó đã không còn là một vị trí về AI nữa mà đã trở thành một vị trí về việc AI cần phải thấp hơn.
Quan điểm trung thực khó hơn. Đó là nhìn vào những gì các hệ thống này thực sự làm, nhìn vào những gì chúng ta thực sự làm, nhận thấy khoảng cách nhỏ hơn so với câu chuyện thoải mái, và đặt ra những câu hỏi thực sự. Hiểu là gì? Trí tuệ là gì?
Điều gì, nếu có, làm cho ý thức đặc biệt, và làm thế nào chúng ta có thể nhận biết? Những người bác bỏ muốn tránh những câu hỏi đó vì câu trả lời có thể không làm chúng ta tự hào. Nhưng tránh né câu hỏi không làm câu hỏi biến mất. Nó chỉ làm cho sự phán xét cuối cùng trở nên rối rắm hơn khi nó đến.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim