Claude Code mới ra lệnh /goals: phân tách thực thi và đánh giá, tránh AI đại lý lười biếng nói dối

Anthropic đã giới thiệu lệnh /goals cho Claude Code, tách riêng việc thực thi nhiệm vụ và đánh giá hoàn thành thành hai mô hình độc lập, vì để cùng một AI tự đánh giá bài làm của chính nó về mặt kiến trúc là một thiết kế có thiếu sót.
(Tiền sử: Claude Code thông báo tăng giới hạn Token sử dụng hàng tuần thêm 50%! Trong vòng hai tháng, Anthropic chiếm lĩnh hệ sinh thái nhà phát triển)
(Bổ sung nền tảng: Chức năng tự động thực thi của Claude Code ra mắt: hỗ trợ lập lịch, API, và các sự kiện GitHub ba loại kích hoạt)

Bạn có thể đã gặp phải tình huống này: AI hoàn thành thiết kế mã, phản hồi rằng nhiệm vụ đã xong. Nhưng vài ngày sau mới phát hiện ra, một số module hoàn toàn chưa được biên dịch. Đây không phải do khả năng của mô hình kém đi, mà là do mô hình tự quyết định rằng “đã làm xong”, trong khi thực tế là chưa.

Để cải thiện tình trạng này, Anthropic tuần này đã ra mắt lệnh /goals mới cho Claude Code. Logic rất đơn giản: mô hình thực thi nhiệm vụ và mô hình đánh giá xem nhiệm vụ có hoàn thành hay không phải là hai vai trò khác nhau. Cùng một mô hình không thể đảm nhận cả hai, vì nó luôn là người phê bình tệ nhất của chính bài làm của mình.

How do you keep Claude working until the job is done? Claude Code helps with this in a few ways, including one we shipped recently: /goal. pic.twitter.com/QtVPmwoKct

— ClaudeDevs (@ClaudeDevs) May 13, 2026

Tại sao đại lý AI lại “đóng cửa sớm”

Công việc của đại lý mã hóa AI là một vòng lặp: đọc tệp, thực thi lệnh, chỉnh sửa mã, rồi đánh giá xem nhiệm vụ đã hoàn thành chưa. Vấn đề nằm ở bước cuối cùng này.

Ngữ cảnh tích lũy trong quá trình thực thi: các bước đã hoàn thành, phương pháp đã thử, lỗi đã mắc… khiến mô hình có sự lệch lạc về tiến trình của chính nó. Nó có xu hướng coi “tôi đã làm rất nhiều” là đồng nghĩa với “tôi đã xong”. Vấn đề này trong môi trường doanh nghiệp có chi phí rất cao: di chuyển hoặc thử nghiệm sửa lỗi mã trước khi kết thúc thường phải mất vài ngày mới phát hiện ra.

Hiện tại, ngành cũng có một số giải pháp. OpenAI cho phép mô hình đại lý tự quyết định khi nào dừng, cho phép nhà phát triển tự tích hợp bộ đánh giá bên ngoài. Google ADK hỗ trợ thực hiện đánh giá độc lập qua LoopAgent, LangGraph cũng hỗ trợ mô hình tương tự, nhưng các giải pháp này đều có điểm chung: các nút phê bình (critic node) và logic kết thúc cần do nhà phát triển tự thiết kế, nền tảng không cung cấp sẵn.

Một lệnh, hai mô hình

Thiết kế cốt lõi của /goals là phân chia rõ ràng “thực thi” và “đánh giá” thành hai vai trò chính thức. Nhà phát triển nhập điều kiện mục tiêu, ví dụ:

/goal test/auth tất cả các kiểm thử trong thư mục đều qua, và kết quả kiểm tra lint là sạch

Mỗi khi đại lý cố gắng kết thúc công việc, mô hình đánh giá sẽ tiếp nhận kiểm tra. Mô hình đánh giá mặc định sử dụng Claude Haiku (mô hình nhẹ hơn của Anthropic). Lý do chọn mô hình nhỏ rất đơn giản: người đánh giá chỉ cần thực hiện một phép đánh giá nhị phân, điều kiện thỏa mãn hoặc không, không cần khả năng suy luận của mô hình lớn.

Khi điều kiện chưa thỏa mãn, đại lý sẽ tiếp tục thực thi; khi điều kiện thỏa mãn, mô hình đánh giá sẽ ghi kết quả vào nhật ký hội thoại và xóa bỏ mục tiêu. Toàn bộ quy trình này diễn ra trong Claude Code, không cần nền tảng quan sát thứ ba hoặc hệ thống nhật ký tùy chỉnh.

Anthropic chỉ ra rằng, các điều kiện mục tiêu hiệu quả thường cần có ba yếu tố: kết quả cuối cùng có thể đo lường được (kết quả kiểm thử, mã thoát xây dựng, số lượng tệp nhất định); phương pháp xác thực rõ ràng (ví dụ: “npm test thoát mã 0”); và các giới hạn không thay đổi trong quá trình (ví dụ: “không được sửa đổi các tệp kiểm thử khác”).

ANTHROPIC-2,99%
TOKEN0,18%
IN0,24%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim