2026-04-13 07:08:17

Tôi nhận thấy một nghịch lý thú vị về cách chúng ta đánh giá các mô hình ngôn ngữ hiện đại. Chúng nghe có vẻ thuyết phục, trả lời tự tin, tạo ra lượng lớn văn bản. Nhưng vấn đề là - lưu loát trong lời nói không phải là cùng một thứ với sự hiểu biết. Sự tự tin không phải là cảm nhận thực tại.

Nếu phân tích gốc rễ của vấn đề, thì đó là một câu chuyện khá cũ. Các bạn còn nhớ hang động của Plato chứ? Những người bị giam giữ trong xích xích chỉ nhìn thấy bóng trên tường và coi đó là thực tại, vì họ không biết gì khác. Chính xác như vậy, tình huống với các mô hình ngôn ngữ mà chúng ta tạo ra ngày nay.

Những hệ thống này không nhìn thấy thế giới. Chúng không nghe, không chạm, không cảm nhận được. Tất cả những gì chúng biết là văn bản. Sách, bài viết, bài đăng, bình luận, bản dịch. Văn bản là cửa ngõ duy nhất của chúng vào thế giới. Và văn bản không phải là thực tại tự thân, mà là mô tả của con người về thực tại. Mô tả này không đầy đủ, thiên vị, thường xuyên bị bóp méo. Trên internet và trong sách có những ý tưởng xuất sắc, có những lời dối trá trắng trợn, có tuyên truyền, có các lý thuyết âm mưu. Các mô hình ngôn ngữ được huấn luyện trên tất cả những thứ này cùng lúc. Chúng chỉ nhìn thấy những bóng mà con người chiếu lên tường.

Nhiều năm qua, người ta nghĩ rằng quy mô sẽ giải quyết tất cả. Dữ liệu nhiều hơn, mô hình mạnh hơn, nhiều tham số hơn - và vấn đề sẽ biến mất. Nhưng không. Nhiều bóng hơn trên tường không đồng nghĩa với thực tại. Các mô hình ngôn ngữ giỏi trong việc dự đoán từ tiếp theo dựa trên xác suất thống kê, nhưng chúng không hiểu các mối liên hệ nhân quả, giới hạn vật lý, hậu quả thực tế của hành động. Đó là lý do tại sao ảo giác không chỉ là một lỗi nhỏ có thể sửa được. Đó là một khuyết điểm cấu trúc của kiến trúc.

Chính vì vậy, sự chú ý ngày càng chuyển hướng sang các mô hình toàn cầu. Đó là những hệ thống xây dựng các biểu diễn nội bộ về cách các quá trình hoạt động, học hỏi qua tương tác, mô phỏng kết quả trước khi hành động. Thay vì hỏi "từ tiếp theo là gì?" họ hỏi "điều gì sẽ xảy ra nếu chúng ta làm điều này?". Các mô hình toàn cầu không chỉ dựa vào văn bản. Chúng có thể làm việc với chuỗi thời gian, dữ liệu cảm biến, phản hồi, bảng biểu, mô phỏng.

Trong thực tế, điều này trông như thế này. Trong logistics, mô hình ngôn ngữ có thể viết báo cáo về một sự cố, còn mô hình toàn cầu có thể mô phỏng cách đóng cửa cảng hoặc tăng giá nhiên liệu sẽ lan rộng qua toàn bộ chuỗi cung ứng. Trong bảo hiểm và quản lý rủi ro, các hệ thống dựa trên văn bản giải thích các chính sách, còn các mô hình toàn cầu nghiên cứu cách rủi ro tiến triển, mô phỏng các sự kiện cực đoan, đánh giá thiệt hại dây chuyền. Các bản sao kỹ thuật số của nhà máy đã là các phiên bản sơ khai của các mô hình toàn cầu. Chúng không chỉ mô tả sản xuất - chúng mô phỏng tương tác của máy móc, vật liệu, thời hạn.

Trong tất cả các trường hợp này, ngôn ngữ hữu ích, nhưng chưa đủ. Cần có mô hình về cách hệ thống thực sự hoạt động, chứ không chỉ là mô tả về cách con người nói về nó.

Chuyển từ các mô hình ngôn ngữ sang các mô hình toàn cầu không phải là từ bỏ cái trước. Đó là định hướng đúng đắn. Trong giai đoạn tiếp theo, các mô hình ngôn ngữ sẽ trở thành giao diện và trợ lý ảo. Các mô hình toàn cầu sẽ cung cấp nền tảng, dự đoán, lập kế hoạch. Ngôn ngữ sẽ nằm trên các hệ thống học dựa trên thực tế.

Trong ẩn dụ của Plato, các tù nhân không thoát ra khi nghiên cứu bóng một cách cẩn thận hơn. Họ thoát ra khi quay lại và nhìn thấy nguồn gốc của những bóng đó, rồi sau đó bước ra khỏi hang vào thế giới thực. AI đang tiến gần đến khoảnh khắc tương tự. Các công ty hiểu ra sớm sẽ ngừng coi ngôn ngữ thuyết phục là sự hiểu biết thực sự và bắt đầu xây dựng các kiến trúc mô phỏng thực tại của chính chúng. Không phải AI nói đẹp về thế giới, mà là AI thực sự hiểu cách nó hoạt động.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
GateFounderDrHan13thAnniversaryLetter
30.01K Phổ biến
#
CryptoMarketsDipSlightly
165.78K Phổ biến
#
IsraelStrikesIranBTCPlunges
29.03K Phổ biến
#
USBlocksStraitofHormuz
705.17K Phổ biến
#
AaveDAOApproves$25MGrant
1.8M Phổ biến

Ghim

sơ đồ trang web

Chủ đề thịnh hành

GateFounderDrHan13thAnniversaryLetter

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

USBlocksStraitofHormuz

AaveDAOApproves$25MGrant

Ghim