AI, tại sao cũng cần phải ngủ?

Vào ngày 31 tháng 3 năm 2026, Anthropic, do một sự cố đóng gói nhầm, đã làm lộ 510k dòng mã nguồn của Claude Code lên kho lưu trữ npm công khai. Chỉ trong vài giờ, mã này đã được phản chiếu lên GitHub và không thể thu hồi lại được.

Nội dung bị rò rỉ rất nhiều, các nhà nghiên cứu an ninh và đối thủ cạnh tranh mỗi bên lấy theo nhu cầu của mình. Nhưng trong tất cả những tính năng chưa được công bố, có một tên gây tranh luận rộng rãi—autoDream, tự động làm mơ.

autoDream là một phần của một hệ thống chạy nền thường trực được gọi là KAIROS (tiếng Hy Lạp cổ, nghĩa là “thời khắc thích hợp”).

KAIROS liên tục quan sát và ghi lại khi người dùng đang làm việc, duy trì nhật ký hằng ngày (có chút ý nghĩa như con tôm hùm). Còn autoDream chỉ khởi động sau khi người dùng tắt máy tính, sắp xếp lại những ký ức được tích lũy ban ngày, xóa bỏ các mâu thuẫn, và chuyển những quan sát mơ hồ thành các sự thật xác định.

Hai thứ này tạo thành một chu kỳ hoàn chỉnh: KAIROS tỉnh táo, autoDream ngủ—các kỹ sư của Anthropic đã chế tạo một lịch sinh hoạt cho AI.

Trong hai năm qua, câu chuyện nóng nhất của ngành AI là Agent: chạy tự chủ, không bao giờ tắt máy, điều này được xem là lợi thế cốt lõi của AI so với con người.

Nhưng công ty đẩy năng lực Agent đi xa nhất lại chính là công ty tự đặt lịch nghỉ cho AI ngay trong mã nguồn của mình.

Tại sao?

Cái giá phải trả của “không bao giờ ngừng”

Một AI không bao giờ tắt máy sẽ đâm vào một bức tường.

Mỗi mô hình ngôn ngữ lớn đều có một “cửa sổ ngữ cảnh”, về mặt vật lý luôn có giới hạn cho tổng lượng thông tin mà nó có thể xử lý cùng lúc. Khi Agent chạy liên tục, lịch sử dự án, sở thích của người dùng và bản ghi hội thoại không ngừng chất chồng. Sau khi vượt qua ngưỡng tới hạn, mô hình bắt đầu quên các chỉ lệnh ban đầu, các điểm mâu thuẫn trước-sau, và bịa đặt sự thật.

Cộng đồng kỹ thuật gọi điều này là “suy thoái ngữ cảnh”.

Nhiều phương án của Agent khá thô bạo: nhét toàn bộ lịch sử vào cửa sổ ngữ cảnh, trông cậy mô hình tự phân biệt đâu là chính đâu là phụ. Kết quả là thông tin càng nhiều thì hiệu suất càng tệ.

Thứ mà não người gặp phải cũng là cùng một bức tường.

Những trải nghiệm ban ngày sẽ nhanh chóng được ghi vào “hải mã”. Đây là một vùng lưu trữ tạm thời có dung lượng hữu hạn, giống như một tấm bảng trắng. Ký ức dài hạn thực sự nằm trong “tân vỏ não”, dung lượng lớn nhưng ghi chậm.

Nhiệm vụ cốt lõi của giấc ngủ ở con người là làm trống tấm bảng đầy ắp và chuyển những thông tin hữu ích sang ổ đĩa cứng.

Phòng thí nghiệm của Björn Rasch (Trung tâm Khoa học Thần kinh, Đại học Zurich, Thụy Sĩ) đã đặt tên cho quá trình này là “củng cố hệ thống chủ động” (active systems consolidation).

Các thí nghiệm về cắt bỏ giấc ngủ liên tục đã chứng minh lặp đi lặp lại: bộ não không ngừng nghỉ sẽ không trở nên hiệu quả hơn; trí nhớ sẽ gặp vấn đề trước, sau đó đến sự chú ý, và cuối cùng ngay cả năng lực phán đoán cơ bản cũng sụp đổ.

Chọn lọc tự nhiên cực kỳ tàn nhẫn với hành vi kém hiệu quả, nhưng giấc ngủ không bị loại bỏ. Từ ruồi giấm đến cá voi, gần như mọi loài động vật có hệ thần kinh đều ngủ. Cá heo, về mặt tiến hóa, đã phát triển “giấc ngủ bán não” để luân phiên nghỉ ngơi giữa hai bán cầu não—nó thà phát minh ra một kiểu ngủ hoàn toàn mới còn hơn là bỏ việc ngủ.

Cảnh cá orca, cá voi trắng và cá heo mõm cười nghỉ ngơi ở đáy ao hồ | Ảnh nguồn: National Library of Medicine (United States)

Hai hệ thống đối mặt với cùng một bộ điều kiện ràng buộc: năng lực xử lý tức thời thì có giới hạn, nhưng kinh nghiệm lịch sử thì không ngừng phình to vô hạn.

Hai bài thi

Trong sinh học có một khái niệm gọi là tiến hóa hội tụ: các loài có quan hệ họ hàng xa nhưng, vì phải đối mặt với các áp lực môi trường tương tự, sẽ tiến hóa độc lập ra các giải pháp tương tự. Ví dụ kinh điển nhất là mắt.

Bạch tuộc và con người đều có mắt kiểu “camera”: một thấu kính có thể điều chỉnh tiêu cự hội tụ ánh sáng lên võng mạc; một vòng mống mắt điều khiển lượng ánh sáng đi vào; và cấu trúc tổng thể gần như giống hệt nhau.

So sánh cấu trúc nhãn cầu giữa bạch tuộc và con người | Ảnh nguồn: OctoNation

Nhưng bạch tuộc là động vật thân mềm, còn con người là động vật có xương sống. Tổ tiên chung của hai bên sống cách đây hơn 510k năm, khi trên Trái Đất vẫn chưa có bất kỳ cơ quan thị giác phức tạp nào. Hai lộ trình tiến hóa hoàn toàn độc lập đã đi tới gần như cùng một đích đến. Bởi để biến ánh sáng hiệu quả thành một hình ảnh rõ ràng, gần như chỉ có một con đường mà các quy luật vật lý cho phép—kiểu camera: các thấu kính có khả năng lấy nét, bề mặt cảm quang tiếp nhận hình ảnh, và “ống kính” điều chỉnh lượng ánh sáng (khẩu độ) — thiếu bất kỳ thứ nào trong ba thứ đó đều không được.

Mối quan hệ giữa autoDream và giấc ngủ của não người có lẽ cũng thuộc loại này—dưới những ràng buộc tương tự, hai loại hệ thống có thể hội tụ về cấu trúc tương tự.

Phải làm việc ở chế độ ngoại tuyến là điểm giống nhau được thể hiện rõ nhất của cả hai.

autoDream không thể chạy khi người dùng đang làm việc. Nó được khởi động độc lập với tư cách một tiến trình con tách nhánh, hoàn toàn cô lập với luồng chính và quyền hạn công cụ bị giới hạn nghiêm ngặt.

Còn não người đối mặt với cùng vấn đề, nhưng giải pháp triệt để hơn: ký ức từ hải mã (vùng lưu trữ tạm thời) được chuyển sang tân vỏ não (vùng lưu trữ dài hạn), và cần một bộ kiểu nhịp sóng điện não chỉ xuất hiện trong giấc ngủ.

Trong số đó, quan trọng nhất là “sóng gai” (sharp wave ripples) ở hải mã: nó có nhiệm vụ đóng gói tuần tự từng mảnh ký ức được mã hóa trong ngày và gửi sang vỏ não. Còn tần số rung chậm của vỏ não và “sóng thoi” do đồi thị phát ra sẽ cung cấp sự phối hợp chính xác về thời gian cho toàn bộ quá trình.

Bộ nhịp này không thể hình thành trong trạng thái tỉnh táo; các kích thích bên ngoài sẽ phá vỡ nó. Vì vậy bạn không phải cứ buồn ngủ mới đi ngủ—mà là não phải đóng “cửa trước” rồi mới mở “cửa sau”.

Nói cách khác, trong cùng một cửa sổ thời gian, việc nạp thông tin và việc sắp xếp cấu trúc là tài nguyên cạnh tranh, chứ không phải tài nguyên bổ sung lẫn nhau.

Mô hình củng cố hệ thống chủ động trong giấc ngủ. A (di chuyển dữ liệu): Trong thời gian ngủ sâu (ngủ sóng chậm), những ký ức vừa được ghi vào “hải mã” (vùng lưu trữ tạm thời) sẽ được phát lại nhiều lần, nhờ đó dần được chuyển và được cố định vào “tân vỏ não” (vùng lưu trữ dài hạn). B (giao thức truyền tải): Quá trình chuyển dữ liệu này phụ thuộc vào “đối thoại” có độ đồng bộ cao giữa hai vùng. Vỏ não sẽ phát ra các sóng điện não chậm (đường màu đỏ) như nhịp điều khiển chính. Dưới tác động của đỉnh sóng, hải mã đóng gói các mảnh ký ức thành tín hiệu tần số cao (vùng sóng gai gợn màu xanh lục), và phối hợp hoàn hảo với sóng mang do đồi thị phát ra (sóng thoi ở đường màu xanh dương). Nó giống như việc khảm chính xác dữ liệu ký ức tần số cao vào các khe trống của kênh truyền tải, đảm bảo thông tin được đồng bộ tải lên tân vỏ não. | Ảnh nguồn: National Library of Medicine (United States)

Một hướng khác là không thực hiện ký ức toàn bộ, mà làm kiểu “biên tập”.

Sau khi autoDream khởi động, nó sẽ không lưu lại tất cả nhật ký. Nó trước tiên đọc các ký ức hiện có để xác nhận thông tin đã biết, rồi quét toàn bộ nhật ký hằng ngày của KAIROS, tập trung xử lý những phần lệch so với nhận thức trước đó: những thứ khác với những gì hôm qua đã nói, và những ký ức phức tạp hơn so với điều trước đó người ta tưởng tượng—sẽ được ưu tiên ghi lại.

Ký ức đã được sắp xếp sẽ được lưu vào một bộ chỉ mục ba lớp: lớp con trỏ nhẹ luôn được nạp, các tệp chủ đề được nạp khi cần, và toàn bộ lịch sử không bao giờ được nạp trực tiếp. Còn những sự thật có thể tra ngay từ mã nguồn dự án (ví dụ: định nghĩa một hàm nằm trong tệp nào) thì thậm chí không hề được đưa vào ký ức.

Trong giấc ngủ, con người gần như làm đúng cùng một việc.

Một nghiên cứu của giảng viên y khoa thuộc Trường Y Harvard, Erin J Wamsley, cho thấy giấc ngủ sẽ ưu tiên củng cố những thông tin không thường lệ, ví dụ như những điều khiến bạn bất ngờ, những điều liên quan đến việc bạn cảm thấy dao động cảm xúc, và những điều liên quan đến vấn đề mà bạn vẫn chưa giải quyết. Trong khi đó, rất nhiều chi tiết đời thường lặp lại và không có đặc trưng sẽ bị loại bỏ, chỉ để lại các quy luật trừu tượng—có thể bạn không nhớ rõ hôm qua trên đường đi làm đã nhìn thấy cụ thể điều gì, nhưng bạn nhớ rất rõ cách đi đường như thế nào.

Điều thú vị là có một nơi mà hai hệ thống lại đưa ra lựa chọn khác nhau. Ký ức mà autoDream tạo ra được ghi rõ trong mã là “hint” (manh mối) chứ không phải “truth” (sự thật). Mỗi lần tác nhân sử dụng, nó đều phải xác minh lại xem hiện còn đúng hay không, vì nó biết những gì mình đã sắp xếp ra có thể không chính xác.

Não người không có cơ chế này. Đó là lý do nhân chứng trong tòa án thường đưa ra lời khai sai. Họ không hề cố tình nói dối, mà vì ký ức được ghép tạm thời từ các mảnh rời trong não; sai lệch mới là chuyện thường.

Tiến hóa có lẽ không cần gắn cho bộ não con người một nhãn “không chắc chắn”. Trong một môi trường nguyên thủy nơi cơ thể cần phản ứng nhanh, tin vào ký ức giúp hành động ngay lập tức; nghi ngờ ký ức khiến do dự—mà do dự thì sẽ thất bại.

Nhưng đối với một AI thường xuyên đưa ra quyết định mang tính tri thức, chi phí để kiểm chứng rất thấp; sự tự tin mù quáng lại nguy hiểm.

Hai bối cảnh khác nhau, suy ra hai bộ đáp án khác nhau.

Sự lười biếng thông minh

Trong sinh học tiến hóa, tiến hóa hội tụ có nghĩa là hai lộ trình độc lập, trong điều kiện không trao đổi thông tin trực tiếp, đi tới cùng một đích đến. Ngoài tự nhiên không có chuyện sao chép, nhưng kỹ sư thì có thể đọc bài báo.

Khi thiết kế cơ chế “ngủ” này, Anthropic rốt cuộc là vì đâm phải bức tường vật lý giống hệt bộ não người, hay vì ngay từ đầu họ đã tham khảo khoa học thần kinh?

Trong mã nguồn bị rò rỉ không hề có trích dẫn tài liệu thần kinh nào; cái tên autoDream cũng gần với một trò đùa của dân lập trình hơn là khoa học. Động lực mạnh mẽ hơn có lẽ vẫn là chính ràng buộc kỹ thuật: ngữ cảnh có giới hạn cứng; chạy dài sẽ dẫn tới tích lũy nhiễu; và việc sắp xếp trực tuyến cũng sẽ làm ô nhiễm suy luận của luồng chính. Họ đang giải một bài toán kỹ thuật, và bắt chước sinh học chưa bao giờ là mục tiêu.

Thứ thực sự quyết định hình dạng đáp án, vẫn là sức nén của chính các ràng buộc.

Trong hai năm qua, ngành AI đã định nghĩa “trí tuệ mạnh hơn” gần như luôn hướng về cùng một phía—mô hình lớn hơn, ngữ cảnh dài hơn, suy luận nhanh hơn, và chạy liên tục 7×24 không ngừng. Hướng đi vĩnh viễn là “nhiều hơn”.

Sự tồn tại của autoDream lại gợi ý một mệnh đề khác: một tác nhân thông minh, có thể còn lười hơn.

Một tác nhân thông minh không bao giờ dừng lại để sắp xếp bản thân sẽ không trở nên thông minh hơn; nó chỉ càng lúc càng trở nên rối loạn.

Bộ não con người, sau hàng trăm triệu năm tiến hóa, đã rút ra một kết luận trông có vẻ vụng về: trí tuệ cần có nhịp điệu. Tỉnh táo để cảm nhận thế giới, ngủ để hiểu thế giới. Khi một công ty AI trong quá trình giải bài toán kỹ thuật độc lập đi tới cùng một kết luận, điều đó có lẽ đang gợi ý:

Trí tuệ có một số chi phí cơ bản không thể né tránh.

Có lẽ, một AI không bao giờ ngủ không phải là AI mạnh hơn. Nó chỉ là một AI chưa nhận ra rằng mình cũng cần ngủ.

Nguồn bài viết: Geek Park

Cảnh báo rủi ro và tuyên bố miễn trừ trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân và cũng không xem xét các mục tiêu đầu tư đặc thù, tình hình tài chính hoặc nhu cầu riêng của từng người dùng. Người dùng cần cân nhắc liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với hoàn cảnh cụ thể của mình hay không. Do đó, khi đầu tư, tự chịu trách nhiệm.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim