Claude Code lộ mã nguồn phân tích sâu, Anthropic tương lai muốn làm gì?

Tiêu đề gốc: What to Prepare for Based on the Claude Code Leak
Tác giả gốc: Elliot Arledge
Biên dịch: Peggy,BlockBeats

Ghi chú của biên tập viên: Rạng sáng ngày 31 tháng 3, Chaofan Shou của Solayer Labs phát hiện rằng Claude Code của Anthropic khi được phát hành lên npm lại vô tình kèm theo toàn bộ mã nguồn. Trong vài giờ, mã liên quan đã được đồng bộ lên GitHub, nhanh chóng gây chú ý.

Một sơ hở trong cấu hình build, nhưng cũng khiến bên ngoài có cơ hội hiếm hoi quan sát tiến độ thực sự của sản phẩm từ góc độ mã. Bài viết này được xây dựng dựa trên phần mã nguồn “vô tình bị công khai” đó; sau khi đọc toàn bộ mã nguồn, tác giả cố gắng trả lời hai câu hỏi: Claude Code đang đi về đâu? Và điều đó có ý nghĩa gì đối với người dùng?

Nhìn từ mã, Claude Code đang được đưa vào một loạt năng lực chưa từng công bố, bao gồm chế độ tự trị chạy liên tục (KAIROS), chế độ PROACTIVE có thể chủ động thực thi nhiệm vụ trong các khoảng trống giữa tin nhắn của người dùng, và cơ chế COORDINATOR dùng để điều phối nhiều tác nhân con. Những thay đổi này cùng chỉ về một hướng rõ ràng: AI đang chuyển từ công cụ chỉ biết phản hồi lệnh sang hệ thống có thể chạy liên tục và chủ động thực thi. Đồng thời, các thiết kế như tự động hóa quyền hạn, cộng tác “vô hình” và trí nhớ cho đội nhóm cũng phản ánh một vấn đề thực tế: khi AI thực sự bước vào quy trình làm việc, làm sao vừa nâng cao hiệu suất vừa kiểm soát rủi ro và ranh giới.

Vậy, đối với người dùng, điều đó có nghĩa gì?

Trên thực tế, các năng lực này không phải là những mảnh ghép rời rạc cộng dồn, mà là đang từng bước xây dựng một “hệ thống tác nhân thông minh”: có khả năng chạy ở hậu trường, ghi nhớ giữa các nhiệm vụ, cộng tác song song giữa các agent, và có thể trực tiếp gọi công cụ để hoàn thành nhiệm vụ. Cuộc cạnh tranh trong tương lai có lẽ sẽ không còn chỉ là năng lực của mô hình, mà là ai có thể làm cho hệ thống này ổn định và dễ kiểm soát hơn.

Việc lần này “vô tình tiết lộ” bản thân nó không quan trọng bằng hướng đi mà nó đã lộ ra trước.

Dưới đây là bản gốc:

Hôm nay sớm hơn, trên X, @Fried_rice phát hiện rằng khi Anthropic phát hành Claude Code CLI lên npm, họ vô tình kèm theo một file source map.

Cụ thể, ở phiên bản 2.1.88 của gói @anthropic-ai/claude-code có chứa một file cli.js.map dung lượng 59.8MB, trong trường sourcesContent có nhúng toàn bộ mã nguồn TypeScript gốc. Đây không phải là tấn công của hacker mà là một sơ sót trong cấu hình build—sản phẩm phục vụ debug lại được đóng gói cùng vào môi trường sản xuất. Nhưng điều đó cũng vô tình làm lộ hướng đi tương lai của Claude Code.

Tôi đã mất vài giờ để đọc các mã nguồn này. Dưới đây là một số điểm tôi chú ý, và chúng có thể có ý nghĩa gì đối với người dùng.

Tính năng trọng điểm

Các tác nhân tự động đang đến

Feature flag được xuất hiện nhiều nhất trong kho mã là KAIROS (xuất hiện 154 lần). Theo cách nhìn từ mã, có vẻ đây là một “chế độ tiến trình giám hộ tự trị”, có thể biến Claude Code thành một tác nhân chạy liên tục. Nó bao gồm phiên nền, một cơ chế tích hợp trí nhớ được gọi là “dream”, đăng ký webhook của GitHub, thông báo đẩy, và cách giao tiếp dựa trên channel.

Ngoài ra còn có chế độ PROACTIVE (xuất hiện 37 lần), cho phép Claude làm việc độc lập giữa các tin nhắn của người dùng. Hệ thống sẽ gửi nhắc nhở “tick” để duy trì hoạt động của tác nhân, và Claude sẽ tự quyết định mỗi lần “được đánh thức” nên làm gì. Lời nhắc thậm chí viết rõ: “Bạn đang tự vận hành”, và hướng dẫn mô hình “tìm kiếm công việc hữu ích”, cũng như “hành động dựa trên phán đoán tốt nhất, thay vì yêu cầu xác nhận”.

COORDINATOR_MODE (xuất hiện 32 lần) còn đi xa hơn—nó biến Claude thành một bộ điều phối (orchestrator), có thể tạo và quản lý nhiều tác nhân worker song song. Coordinator này chịu trách nhiệm hoàn thành các hoạt động nghiên cứu, hiện thực hóa và xác minh bằng cách phân công nhiệm vụ cho các worker khác nhau. Trong lời nhắc hệ thống còn bao gồm các chỉ dẫn chi tiết về cách viết prompt cho worker, khi nào tiếp tục sử dụng worker hiện có, khi nào tạo agent mới, và cách xử lý khi worker thất bại.

Gợi ý về quyền hạn có thể sẽ biến mất

Có một cờ tên là TRANSCRIPT_CLASSIFIER (xuất hiện 107 lần). Theo ngữ cảnh, nó trông giống như một “chế độ tự động”, dùng AI classifier để tự động phê duyệt quyền truy cập công cụ. Nếu tính năng này được ra mắt, các nhắc nhở xác nhận quyền hạn thường xuyên làm gián đoạn quy trình làm việc có thể sẽ trở thành tùy chọn, thậm chí biến mất hoàn toàn trong các thao tác đáng tin.

Mã tên mô hình và hệ thống phiên bản

Nguồn mã cũng hé lộ một số mã tên nội bộ của các mô hình Claude:

Capybara dường như là một biến thể của Claude 4.6. Trong phần chú thích có đề cập “Capybara v8”, đồng thời ghi lại một số bản sửa lỗi, chẳng hạn như: tỷ lệ bịa đặt (giả mạo) là 29–30% (so với v4 là 16.7%), xu hướng chú thích quá mức bằng code, và một cơ chế được gọi là “assertiveness counterweight”.

Fennec từng là một mã tên, sau đó được chuyển thành Opus 4.6.

Numbat vẫn chưa được phát hành. Có ghi chú: “Xóa đoạn này khi phát hành numbat.”

Trong code còn đề cập opus-4-7 và sonnet-4-8, và nêu rõ rằng các số phiên bản này không nên xuất hiện trong các commit công khai—điều này cho thấy các phiên bản đó đã tồn tại ở nội bộ.

“Chế độ ẩn danh”: ẩn danh tham gia mã nguồn mở

Còn có một tính năng tên là “Undercover Mode”, dùng riêng cho nhân viên Anthropic bật khi dùng Claude Code để gửi mã lên các kho công cộng. Chế độ này sẽ loại bỏ mọi dấu hiệu liên quan đến AI, bao gồm:

· Trong commit không bao gồm bất kỳ AI attribution nào

· Ẩn mã tên mô hình

· Loại bỏ mọi đề cập đến “Claude Code” hoặc AI

· Thậm chí sẽ không cho biết mô hình của chính nó là gì

Trong lời nhắc có ghi rõ: “Bạn đang chạy ở chế độ UNDERCOVER trong một kho công cộng/mã nguồn mở. Thông tin trong commit, tiêu đề PR và nội dung bài viết không được chứa bất kỳ thông tin nội bộ Anthropic nào. Đừng lộ danh tính.”

Ngoài ra không có công tắc bắt buộc phải tắt—chỉ cần hệ thống không thể xác nhận rằng hiện tại đang ở kho nội bộ thì mặc định chế độ này sẽ được bật.

Chế độ giọng nói

VOICE_MODE xuất hiện 46 lần, cho thấy hệ thống đã tích hợp năng lực tương tác bằng giọng nói, bao gồm chuyển giọng nói thành văn bản và chuyển văn bản thành giọng nói.

Một hệ thống “thú cưng điện tử”

Điểm này khá thú vị. Trong code có một hệ thống BUDDY bị ẩn, về bản chất là một “thú cưng điện tử” trong terminal (tương tự như Tamagotchi). Bao gồm:

· 18 loài sinh vật (vịt, ngỗng, mèo, rồng, bạch tuộc, cú mèo, chim cánh cụt, rùa, hồn ma, khủng long sáu cạnh, v.v.)

· Hệ thống độ hiếm (xác suất cấp huyền thoại là 1%)

· Trang trí ngoại hình (vương miện, mũ lễ hội, vòng hào quang, mũ phù thủy, v.v.)

· Chỉ số thuộc tính (DEBUGGING, PATIENCE, CHAOS, WISDOM, SNARK)

· Thậm chí còn có phiên bản “lấp lánh”

Trong đó, tên loài capybara (capybara) được làm nhiễu thông qua String.fromCharCode(), nhằm tránh kích hoạt hệ thống phát hiện rò rỉ nội bộ—điều này cũng cho thấy mã tên đó mang tính nhạy cảm.

Các tính năng đáng chú ý khác

FORK_SUBAGENT: cho phép tách chính nó thành nhiều agent song song

VERIFICATION_AGENT: dùng để xác minh độc lập, theo kiểu đối kháng

ULTRAPLAN: năng lực lập kế hoạch nâng cao

WEB_BROWSER_TOOL: tự động hóa trình duyệt

TOKEN_BUDGET: cho phép chỉ rõ ngân sách token (ví dụ “+500k” hoặc “chi 2M token”)

TEAMMEM: hỗ trợ chia sẻ trí nhớ giữa các nhóm

Điều đó có nghĩa là gì

Một vài nhận định cốt lõi:

Claude Code đang tiến mạnh theo hướng “tự chủ cao”. KAIROS, PROACTIVE và COORDINATOR_MODE những tính năng này chỉ về một tương lai: Claude có thể chạy như một tiến trình giám hộ ở hậu trường, liên tục theo dõi kho và chủ động thực thi nhiệm vụ.

Sự ma sát về quyền hạn đang bị giảm bớt. Cơ chế tự động phê duyệt cho thấy họ đang giảm các bước xác nhận thủ công thường xuyên.

Hệ thống phiên bản mô hình còn phức tạp hơn nhiều so với API công khai. Ở nội bộ có nhiều biến thể, các chế độ nhanh và hệ thống mã tên, tương ứng với các năng lực và vấn đề khác nhau.

Các cơ chế an toàn được đặt nặng cao. Chỉ riêng việc kiểm tra lệnh Bash đã có hơn 2500 dòng mã, cộng thêm sandbox, chế độ ẩn danh và làm sạch đầu vào.

Sản phẩm đang đưa vào “tính cách”. Hệ thống Buddy cho thấy Claude Code không chỉ là công cụ, mà đang cố gắng trở thành một “người bạn”.

Cách tự xem

Tính đến thời điểm viết bài, các mã nguồn này vẫn có thể lấy được trên npm. Tải @anthropic-ai/claude-code@2.1.88, tìm cli.js.map, parse JSON và trích xuất trường sourcesContent là được. Tôi sẽ không phân phối lại mã, nhưng việc phân tích và thảo luận nội dung có thể truy cập công khai là hợp lý.

Phát hiện ban đầu là nhờ @Fried_rice trên X.

[Liên kết bản gốc]

Bấm để tìm hiểu BlockBeats đang tuyển dụng vị trí

Chào mừng bạn tham gia cộng đồng chính thức của律动 BlockBeats:

Telegram kênh đăng ký: https://t.me/theblockbeats

Telegram nhóm trao đổi: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim