Không đùa, mã nguồn Claude Code bị rò rỉ, 50.000 dòng mã bị lộ ra

robot
Đang tạo bản tóm tắt

Chơi cổ phiếu thì hãy xem báo cáo phân tích của nhà phân tích Kim Qilin, có thẩm quyền, chuyên nghiệp, kịp thời, toàn diện—giúp bạn khai phá các cơ hội theo chủ đề tiềm năng!

(Nguồn:爱范儿)

Thế giới là một ban nhạc khổng lồ được lắp ghép từ “cả đội làm theo kiểu chợ trời”.

Chiều nay, nhà phát triển Chaofan Shou đã đăng một bài tweet, trực tiếp tung ra gói nén mã nguồn hoàn chỉnh của công cụ lệnh Claude Code phiên bản mới nhất của Anthropic, src.zip.

Bài tweet này nhanh chóng bùng nổ trong cộng đồng nhà phát triển, chỉ trong vài giờ, lượt xem đã vượt 5,3 triệu.

Phần bình luận lập tức sôi động lên; người dùng @ai_for_success chỉ nói một câu: 「Gọi ngay cho Dario!」(Dario Amodei là CEO của Anthropic);

Một cư dân mạng thì tuôn lời thô tục thẳng tay::「Chết tiệt rồi。」Một nhà phát triển khác là @realsigridjin còn nhanh hơn, đã sao lưu dự phòng mã nguồn bị rò rỉ lên GitHub rồi; tên kho lưu trữ là instructkr/claude-code, được ghi là 「Claude Code Snapshot for Research」。

Nói cách khác, dù Anthropic khẩn cấp xóa các tệp gốc, thì mã nguồn vẫn đã được lưu giữ vĩnh viễn trong cộng đồng mã nguồn mở. Quy mô lần rò rỉ này còn đáng kinh ngạc: gần 2.000 tệp, hơn 500.000 dòng mã TypeScript, tất cả đều bị phơi bày công khai trên Internet.

▲Kèm theo địa chỉ

Nhưng, một “gã khổng lồ” AI như vậy, lõi mã nguồn sao lại bị rò rỉ? Câu trả lời nghe xong cũng làm người ta vừa buồn cười vừa khóc: khi đóng gói phát hành lên npm, họ quên xóa các tệp .map.

Tuy nhiên, khi các nhà phát triển trên toàn thế giới đổ xô vào bản mã nguồn này, rất khó không thốt lên kinh ngạc, vì trong phần mã vốn không nên công khai này—ngoài mã nguồn của Claude Code—Anthropic còn giấu cả một bộ “bản thiết kế AI” vừa lãng mạn vừa “hardcore”:

Có một “thú cưng cyber” có thể ở trong terminal để đồng hành bạn viết code, và còn có một trợ lý AI thường trực biết tự “mơ” vào nửa đêm để tự整理 trí nhớ.

Một thảm họa PR mang tầm sử thi, biến thành buổi “ra mắt hoang dã” làm chấn động ngành

Trước khi nói về những tính năng tương lai khiến người ta háo hức, trước hết hãy xem Anthropic hiện đang “khốn khổ” đến mức nào.

Nếu gần đây bạn đã dùng API của Claude, rất có thể bạn đã gặp phải một vấn đề kỳ quặc: hạn mức sử dụng của bạn tụt xuống với tốc độ hoàn toàn bất thường, như nước rò rỉ trong bồn tắm. Hiện Anthropic vẫn đang cuống cuồng điều tra bug khiến mức tiêu hao Token tăng vọt này.

Trong lúc gặp mưa lại thêm gió, Token Bug vẫn chưa được sửa xong, thì quần lót cũng đã bị lột sạch.

Lần này gây họa chính là tệp .map(Source Map); cả nhà phát triển front-end lẫn Node.js đều không xa lạ.

Nó có tác dụng ánh xạ mã production đã được nén và làm rối về mã nguồn gốc, giúp nhà phát triển debug tại chỗ. Nhưng khi phát hành chính thức lên các kho mã công cộng như npm, việc xóa tệp .map là thao tác cơ bản được ghi ngay ở trang đầu tiên của mọi hướng dẫn dành cho người mới.

Thế nhưng, Anthropic—vốn luôn treo miệng chuyện “an toàn, cẩn trọng”—lại phạm phải một lỗi kiểu thực tập sinh như vậy.

Bản kiến trúc bị rò rỉ cũng đủ gây chấn động: lớp công cụ gồm hơn bốn chục mô-đun chức năng, bao gồm đọc/ghi tệp, thực thi Bash đến việc sinh ra các sub Agent; một lõi suy luận QueryEngine.ts với gần 50.000 dòng code chịu trách nhiệm điều phối chuỗi suy nghĩ; ngoài ra còn có bộ điều phối đa tác nhân coordinator và module cầu nối với IDE.

Ngoài ra, các tính năng chưa phát hành mà nhà phát triển bới ra từ mã nguồn còn chứa lượng thông tin cực lớn.

Trong số tất cả các tính năng bị giấu kín trong bản rò rỉ này, dự án mang mã BUDDY có mức độ được thảo luận cao nhất. Người dùng @baanditeagle đã đăng ảnh chụp màn hình tính năng BUDDY trong phần bình luận của bài gốc do Chaofan Shou đăng, khiến cả cuộc thảo luận bùng nổ hoàn toàn.

Hãy tưởng tượng cảnh đó: bạn đang gõ code trong terminal nền đen chữ trắng, thì đột nhiên, ngay cạnh ô nhập liệu bật lên một bong bóng hội thoại phong cách pixel—bên trong là một “thú cưng cyber” riêng dành cho bạn. Cài đặt của nó rất chi tiết:

Điều này khiến người ta nhớ đến “Clip pẹp mắt (Clippy)” gây phiền của Microsoft Office ngày xưa. Nhưng BUDDY có thể nói là phiên bản tiến hóa tối thượng của nó.

Điểm thú vị là, dựa trên mã nguồn, tính năng này ban đầu dự kiến từ ngày 1 đến 7 tháng 4 sẽ được “hâm nóng” như một trứng Phục Sinh; tháng 5 sẽ đưa trước để nhân viên Anthropic thử nghiệm nội bộ. Nhưng bây giờ, cả thế giới đã biết trước “niềm vui bất ngờ” này.

Một AI biết “mơ”, và đội ngũ Anthropic không ngủ được

Nếu nói BUDDY là trứng Phục Sinh lãng mạn của kỹ sư, thì chức năng mang mã KAIROS lại bộc lộ hoàn toàn tham vọng của Anthropic trên lộ trình hướng tới AGI.

Hiện tại, khi chúng ta trò chuyện với mô hình lớn, cơ bản là kiểu “xem xong là xóa”—tắt trang, mở cuộc trò chuyện mới, mọi thứ bắt đầu lại từ đầu. KAIROS muốn phá vỡ tình thế đó; nó được định nghĩa là “Always-On Claude(Claude luôn online)”.

Đây không chỉ là một kho lưu trữ trí nhớ dạng văn bản dài. KAIROS có thể duy trì trí nhớ liên tục giữa các cuộc hội thoại khác nhau, cất thói quen làm việc và bối cảnh dự án của bạn vào một thư mục riêng tư. Nó thậm chí có quyền chủ động khởi động nhiệm vụ.

Ngoài ra, trong mã còn có một cơ chế mới mang tên Nightly Dreaming(mơ vào ban đêm)。

Hiểu thế nào đây? Trong cơ chế sinh lý của con người, “mơ” khi ngủ là quá trình then chốt để não sắp xếp lại các mảnh ký ức ban ngày, loại bỏ các synap không cần thiết và củng cố các thông tin quan trọng.

Anthropic đưa khái niệm mô phỏng sinh học này vào AI. Để ngăn nhật ký trí nhớ dài hạn cứ thế phình to vô hạn dẫn đến rối loạn logic, KAIROS sẽ tự động khởi chạy tiến trình “mơ” vào ban đêm. Ngay trong mã, họ còn xử lý chi tiết vấn đề timestamp vượt qua ngày vào lúc nửa đêm để đảm bảo tiến trình “mơ” không bị gián đoạn.

Cụ thể, trong tiến trình này, Claude sẽ “truy ngược” các tương tác trong ngày của bạn ở hậu trường như cách não người làm, lọc bỏ thông tin dư thừa, rồi cô đọng phần cốt lõi thành trí nhớ dài hạn.

Ban ngày, AI giúp bạn viết code; khi bạn ngủ say về đêm, nó ở một mình trong máy chủ “mơ” để hiểu bạn hơn. Biến một bài toán kỹ thuật lạnh lùng(nén và truy xuất cửa sổ ngữ cảnh)thành một giải pháp đầy ẩn dụ về sinh mệnh—lối tư duy sản phẩm như vậy đúng là khiến người ta lập tức thấy ấn tượng.

Ngoài BUDDY và KAIROS, mã nguồn còn giấu nhiều thứ hơn nữa:

Có thể nói rằng, trong khi các mô hình lớn khác vẫn đang miệt mài chạy đua điểm số, chạy đua hiệu ứng đa phương thức, thì Anthropic đã thử âm thầm xây dựng từ tầng nền một hệ sinh thái “nhân viên số” hoàn chỉnh: có trí nhớ(KAIROS),có năng lực lập kế hoạch(ULTRAPLAN),có hợp tác nhóm(Coordinator),thậm chí còn có bạn đồng hành mang theo cảm xúc(BUDDY)。

Nếu không có gì bất ngờ, nhân viên Anthropic hẳn đang trải qua một đêm không ngủ. Bug tiêu hao Token vẫn chưa được giải quyết xong, lại thêm một vụ rò rỉ mã nguồn mang tầm sử thi nữa—với bất kỳ công ty công nghệ nào, đó đều là thảm họa.

Nhưng thảm họa này lại khiến người ta vừa bồi hồi vừa cảm khái.

Trong ngành AI ngày càng tràn ngập cảnh vẽ bánh trên slide PPT, phát hành hợp đồng tương lai và cạnh tranh đồng chất hóa như hôm nay, Anthropic lại “trưng ra” cho thế giới thấy họ thực sự đang làm cái gì tiên phong—theo cách vừa lúng túng vừa kém thể diện nhất.

Tất nhiên, cũng có người nhìn ra vấn đề sâu hơn. Người dùng @QiyangYao viết trong phần bình luận:

Ẩn sau tai nạn kỹ thuật nhìn như buồn cười là một lỗ hổng mang tính hệ thống trong quản lý an toàn của công ty AI hàng đầu này. Anthropic đã bỏ ra hàng chục tỷ USD nghiên cứu một vấn đề tối thượng: làm sao để AI trở nên giống con người hơn. Sự cố rò rỉ lần này lại đưa ra một câu trả lời bất ngờ: không cần vội—hãy trước tiên khiến con người giống AI đi đã.

Ví dụ như, học cách tự chạy một danh sách kiểm tra trước khi phát hành.

Lượng lớn tin tức, diễn giải chính xác—tất cả có trên ứng dụng Sina Finance APP

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim