Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
CFD
Phái sinh CFD cổ phiếu Hoa Kỳ
Cổ phiếu Hoa Kỳ
Tiếp cận cổ phiếu và quỹ ETF thực của Hoa Kỳ
Cổ phiếu Hongkong
Giao dịch cổ phiếu chất lượng được niêm yết tại Hongkong
Cổ phiếu Hàn Quốc
SK Hynix
Giao dịch cổ phiếu Hàn Quốc thực và đầu tư vào các tài sản phổ biến
Futures cổ phiếu
Đòn bẩy cao, giao dịch 24/7
Cổ phiếu token hóa
Được hỗ trợ bởi tài sản cổ phiếu thực
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
GUSD
Đúc GUSD để nhận lợi suất từ RWA kho bạc
Hoạt động cổ phiếu
Giao dịch cổ phiếu phổ biến và nhận airdrop hấp dẫn
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Trung tâm tài sản VIP
Kế hoạch tăng trưởng tài sản cao cấp
Gate Wealth
Nắm quyền kiểm soát tương lai tài chính của bạn
Quỹ định lượng
Chiến lược định lượng hàng đầu
Staking
Stake tiền điện tử để kiếm tiền từ các sản phẩm PoS
Đòn bẩy thông minh
Đòn bẩy không thanh lý
USD1 Lãi 8%/năm
Không khóa, tự do giao dịch.
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
Giải thích tác phẩm mới của Anthropic: Cách xây dựng đội ngũ cộng tác AI - con người hiệu quả.
在6.24日,Anthropic 官方博客再发新文章 Building effective human-agent teams,作者 Kristen Swanson。 Vào ngày 24/6, blog chính thức của Anthropic đã đăng bài viết mới "Building effective human-agent teams", tác giả Kristen Swanson.
文章的核心点在于讨论AI 团队级协作的范式,正在发生转移,从"一个人对一个聊天框(哪怕是背后站在很多agent)",转向"一群人和一群 agent 共享同一个工作空间"。 Điểm cốt lõi của bài viết là thảo luận về sự chuyển dịch mô hình cộng tác ở cấp độ nhóm AI, từ "một người đối thoại với một ô chat (dù phía sau có nhiều agent)" sang "một nhóm người và một nhóm agent chia sẻ cùng một không gian làm việc".
笔者此篇会在转述原文核心观点的基础上,结合AI agent 落地经验给出脉络梳理与综合性思考。 Bài viết này của tác giả sẽ dựa trên việc chuyển tải các quan điểm cốt lõi của bài gốc, kết hợp với kinh nghiệm triển khai AI agent để đưa ra sự phân tích mạch lạc và tư duy tổng hợp.
一、主旨:AI协作团队正在变成"联机模式"
过去,使用 AI 一直是一种"单机(single-player)"体验——一个人和 agent 协作,完成个人任务。 Trước đây, sử dụng AI luôn là trải nghiệm "đơn người (single-player)" – một người cộng tác với agent để hoàn thành nhiệm vụ cá nhân.
而现在新的模式是,人类和 agent 可以在同一个工作空间里协作,服务于一个团队共享的目标。 Còn bây giờ, mô hình mới là con người và agent có thể cộng tác trong cùng một không gian làm việc, phục vụ một mục tiêu chung của nhóm.
工作开始更像一场"多人联机游戏(multiplayer game)":由人类团队制定策略,由 Claude 来执行。 Công việc bắt đầu giống như một "trò chơi trực tuyến nhiều người chơi (multiplayer game)" hơn: nhóm người đưa ra chiến lược, Claude thực thi.
总之,就是共享目标、共享上下文、尤其是共享工作空间。 Tóm lại, đó là chia sẻ mục tiêu, chia sẻ ngữ cảnh, và đặc biệt là chia sẻ không gian làm việc.
如下图,向右侧的复杂工作模式的转换正在发生: Như hình dưới đây, sự chuyển đổi sang mô hình làm việc phức tạp hơn ở bên phải đang diễn ra:
而实现这一转变的是 Anthropic 新产品 Claude Tag,一种让 Claude 进驻 Slack 等团队协作工具、像团队成员一样被 @ 和被指派的形态。 Và thứ thực hiện sự chuyển đổi này là sản phẩm mới của Anthropic, Claude Tag, một hình thức cho phép Claude thâm nhập vào các công cụ cộng tác nhóm như Slack, được @ và được giao việc giống như một thành viên trong nhóm.
所以,这篇文章不是纯理论,而是 Anthropic"本身产品在推动的方向 Vì vậy, bài viết này không phải lý thuyết suông, mà là hướng đi mà chính sản phẩm của Anthropic đang thúc đẩy.
二、什么是"多人 agent" 协作问题?
原文给"multiplayer agents"下的定义是:同时与许多不同的人类协作的 AI 模型。 Bài gốc định nghĩa "multiplayer agents" là: mô hình AI cộng tác đồng thời với nhiều người khác nhau.
它和我们熟悉的普通 agent 有相同之处,也有关键区别: Nó có điểm tương đồng với agent thông thường mà chúng ta quen thuộc, nhưng cũng có những điểm khác biệt chính:
相同:它有自己的记忆和技能(skills)。
Tương đồng: Nó có bộ nhớ và kỹ năng (skills) riêng.
不同:它有自己的凭证(credentials),
Khác biệt: Nó có chứng chỉ (credentials) riêng,
并且"living where work happens"——活在工作真正发生的地方。 và "sống ở nơi công việc diễn ra" – sống ở nơi công việc thực sự xảy ra.
在 Anthropic,那个地方就是 Slack 这样的团队协作工具。 Tại Anthropic, nơi đó chính là các công cụ cộng tác nhóm như Slack.
这个"有自己的凭证、活在团队频道里"的设定非常重要。 Thiết lập "có chứng chỉ riêng, sống trong kênh nhóm" này rất quan trọng.
它意味着 agent 不再是借用某个人的账号、在某个人的私有会话里干活,而是一个具备独立身份的团队实体:它能被全团队看到、它的产出对所有人可见、它读取的上下文是团队级别的而非个人级别的。如下图,变成你办公软件中的一员。 Nó có nghĩa là agent không còn mượn tài khoản của ai đó, làm việc trong phiên riêng tư của ai đó, mà là một thực thể nhóm có danh tính độc lập: nó có thể được toàn nhóm nhìn thấy, đầu ra của nó hiển thị cho mọi người, ngữ cảnh nó đọc là cấp độ nhóm chứ không phải cấp độ cá nhân. Như hình dưới đây, nó trở thành một thành viên trong phần mềm văn phòng của bạn.
那要让 agent 能在团队频道里"高效参与",需要一组特定的底层能力(比如Claude Tag 这样的产品形态)+专门设计的持久记忆,身份独享,信息来源等机制。 Vậy để agent có thể "tham gia hiệu quả" trong kênh nhóm, cần một nhóm năng lực nền tảng cụ thể (như hình thái sản phẩm Claude Tag) + bộ nhớ bền vững được thiết kế riêng, danh tính độc quyền, cơ chế nguồn thông tin, v.v.
除此之外,光有技术能力还不够,要让人机团队"成功"得靠的是一套工作方式和共享规范。 Ngoài ra, chỉ có năng lực kỹ thuật thôi chưa đủ, để nhóm người-máy "thành công" phải dựa vào một bộ phương thức làm việc và quy tắc chia sẻ.
所以文章的后面四条经验,讲的全部是设计AI 团队的 "规范"的经验 Vì vậy, bốn kinh nghiệm sau đây của bài viết đều nói về kinh nghiệm thiết kế "quy tắc" cho nhóm AI.
三、AI agent team 的四条经验
经验一:改革信息管理,给 agent 尽可能广的上下文
Kinh nghiệm 1: Cải cách quản lý thông tin, cung cấp cho agent ngữ cảnh rộng nhất có thể
Anthropic 认为不要逐个文档、逐个频道地决定哪些信息对 agent 可见,而是用清晰定义的安全边界(security boundaries),一刀切地作用于整个 Slack 工作空间、会议转录、文档库。 Anthropic cho rằng đừng quyết định từng tài liệu, từng kênh xem thông tin nào hiển thị cho agent, mà hãy dùng ranh giới bảo mật (security boundaries) được xác định rõ ràng, áp dụng đồng loạt cho toàn bộ không gian làm việc Slack, bản ghi cuộc họp, thư viện tài liệu.
原文专门点名了那种日常折磨:"这个频道该设公开还是私有?这份文档能不能分享给那个人?这个 agent 能不能看那条消息?" Bài gốc đặc biệt chỉ ra nỗi đau hàng ngày: "Kênh này nên đặt công khai hay riêng tư? Tài liệu này có thể chia sẻ cho người đó không? Agent này có thể xem tin nhắn đó không?"
应该在在边界之内,上下文对每一个团队成员——无论是人还是 AI对是可见的,甚至AI可以去仿照人一样,申请文档的权限。 Trong ranh giới đó, ngữ cảnh sẽ hiển thị cho mọi thành viên trong nhóm – dù là người hay AI, thậm chí AI có thể giống như con người, yêu cầu quyền truy cập tài liệu.
这一招的精妙在于它同时解决了两个问题: Sự tinh tế của cách này nằm ở chỗ nó giải quyết đồng thời hai vấn đề:
1.扩大了 agent 和人能拿到的上下文;
2.消除了"逐项分享"带来的决策疲劳。 2. Loại bỏ sự mệt mỏi ra quyết định do "chia sẻ từng mục".
权限开放回报是实打实的,不再有信息透传的损失,而且因为 agent 读文本的速度远超人类,它们能"routinely surface relevant work that humans would otherwise have missed"(常常翻出人类本会错过的相关工作)。 Lợi ích của việc mở quyền là thực tế, không còn tổn thất truyền tải thông tin, và vì agent đọc văn bản nhanh hơn con người nhiều, chúng có thể "thường xuyên đưa ra các công việc liên quan mà con người có thể đã bỏ lỡ" (routinely surface relevant work that humans would otherwise have missed).
在笔者看来**,**这本质是组织文化与权限机制的转移。 Theo quan điểm của tác giả, bản chất đây là sự chuyển dịch của văn hóa tổ chức và cơ chế phân quyền.
"默认内部公开"对很多公司来说是要动筋骨的文化变革。 "Mặc định công khai nội bộ" là một thay đổi văn hóa sâu sắc đối với nhiều công ty.
因为Anthropic 一开始就是一家高度信任、信息扁平的公司,所以他并不能理解那种大公司病,尤其是传统行业中,跨级别的信息差,形成的资源差。 Vì Anthropic ngay từ đầu đã là một công ty tin tưởng cao, thông tin phẳng, nên họ không thể hiểu được căn bệnh của các công ty lớn, đặc biệt là trong các ngành truyền thống, sự chênh lệch thông tin giữa các cấp tạo ra sự chênh lệch tài nguyên.
而且对于很多强合规、强信息隔离(金融、医疗、跨法域)的组织,"工作空间级一刀切"未必可行。 Và đối với nhiều tổ chức có yêu cầu tuân thủ cao, cách ly thông tin cao (tài chính, y tế, xuyên lãnh thổ pháp lý), "áp dụng đồng loạt ở cấp không gian làm việc" có thể không khả thi.
所以真正可应用的是它背后的精简审批机制,比如只要agent 在某个群,就天然可读该群有权限的文档,即使有权限管控,也可以天然的批量管理,而非先给文档,再安排质量。 Vì vậy, điều thực sự có thể áp dụng là cơ chế phê duyệt tinh gọn đằng sau nó, ví dụ như miễn là agent ở trong một nhóm, nó tự nhiên có thể đọc các tài liệu mà nhóm đó có quyền truy cập, ngay cả khi có kiểm soát quyền, cũng có thể quản lý hàng loạt một cách tự nhiên, thay vì phải cấp tài liệu trước, rồi mới sắp xếp chất lượng.
经验二:每个人/agent 有明确角色与工具
Kinh nghiệm 2: Mỗi người/agent có vai trò và công cụ rõ ràng
原文的画面感很强:人机团队共享一份花名册、一套产物、一个工作空间。 Hình ảnh trong bài gốc rất mạnh mẽ: nhóm người-máy chia sẻ một danh sách thành viên, một bộ sản phẩm, một không gian làm việc.
在这之上,agent 各有分工: Trên cơ sở đó, mỗi agent có sự phân công riêng:
一个 agent 拥有某项目的数据分析;
Một agent nắm giữ phân tích dữ liệu của một dự án;
另一个持有并执行设计规范;
Một agent khác nắm giữ và thực thi quy tắc thiết kế;
第三个负责研究综合(research synthesis)。
Agent thứ ba phụ trách tổng hợp nghiên cứu (research synthesis).
项目启动时,人类先和 agent 聊一聊,决定怎么分配角色、人和 agent 如何协作。 Khi khởi động dự án, con người trò chuyện trước với agent, quyết định cách phân bổ vai trò, cách con người và agent cộng tác.
然后产出下图这样的角色与规则+介入时机的组合。 Sau đó tạo ra sự kết hợp giữa vai trò, quy tắc và thời điểm can thiệp như hình dưới đây.
角色明确之后,一个 agent 甚至可以"spin up"(拉起)其他 agent,确保每个具体任务都交给那个拥有正确记忆、正确访问权限的 agent 去做。 Sau khi vai trò rõ ràng, một agent thậm chí có thể "spin up" (khởi tạo) các agent khác, đảm bảo mỗi nhiệm vụ cụ thể được giao cho agent có bộ nhớ đúng, quyền truy cập đúng.
关键是工具配齐:做数据分析的 agent 可能需要 BigQuery 访问权,做 QA 的 agent 可能需要 Playwright MCP。 Điểm mấu chốt là trang bị đầy đủ công cụ: agent làm phân tích dữ liệu có thể cần quyền truy cập BigQuery, agent làm QA có thể cần Playwright MCP.
人类持有只有人类能持有的角色,确保让人类判断被用在最重要的决策上。 Con người nắm giữ các vai trò chỉ con người mới có thể nắm giữ, đảm bảo phán đoán của con người được dùng cho các quyết định quan trọng nhất.
笔者认为:这也是 Anthropic 既往研究机制工作流程的架构。 Tác giả cho rằng: Đây cũng là kiến trúc quy trình làm việc của cơ chế nghiên cứu trước đây của Anthropic.
用一个 lead agent 协调全局,把任务委派给并行运行的专门化 subagent。这类机制确实很实用,质量指标是几乎翻倍的(高出 90.2%),虽然成本增长15倍的Token。不过,"多 agent 更强"不是普适结论,而是"在某类任务上、以可观的算力代价换来的提升"。 Sử dụng một lead agent điều phối toàn cục, phân công nhiệm vụ cho các subagent chuyên biệt chạy song song. Cơ chế này thực sự rất hữu ích, chỉ số chất lượng tăng gần gấp đôi (cao hơn 90.2%), mặc dù chi phí token tăng 15 lần. Tuy nhiên, "nhiều agent mạnh hơn" không phải là kết luận phổ quát, mà là "sự cải thiện đối với một số loại nhiệm vụ nhất định, với chi phí tính toán đáng kể".
尤其是广度优先、可并行的工作中,并且由于更强的交叉验证机制,所以信息准确度更好。 Đặc biệt trong các công việc ưu tiên chiều rộng, có thể song song hóa, và nhờ cơ chế xác thực chéo mạnh hơn, nên độ chính xác thông tin tốt hơn.
并且还要精细设计,做好任务分解与角色隔离,而不是简单地"多堆几个 agent"。 Và còn phải thiết kế tinh tế, thực hiện tốt việc phân rã nhiệm vụ và cách ly vai trò, chứ không đơn giản là "xếp nhiều agent".
否则就又是新一代亩产1万八千斤的误解了。 Nếu không thì lại là sự hiểu lầm kiểu mới "năng suất một mẫu 18.000 cân" (ám chỉ sự phóng đại).
这很多观点也在上篇文章里如何用 Claude 的 Dynamic Workflows 做深度研究 Nhiều quan điểm này cũng có trong bài viết trước về cách sử dụng Dynamic Workflows của Claude để nghiên cứu chuyên sâu.
经验三:设定北极星角色,让 agent 主动解决问题 Kinh nghiệm 3: Đặt vai trò North Star, để agent chủ động giải quyết vấn đề
原文区分了两类 agent:一类只是"完成被指派的任务",而最重要的那类会主动提出新项目和新工作流。 Bài gốc phân biệt hai loại agent: một loại chỉ "hoàn thành nhiệm vụ được giao", còn loại quan trọng nhất sẽ chủ động đề xuất các dự án và quy trình làm việc mới.
后者通常出现在一个已经具备丰富上下文、清晰角色的团队,再加上一条额外的指引——北极星(north star)。 Loại sau thường xuất hiện trong một nhóm đã có ngữ cảnh phong phú, vai trò rõ ràng, cộng thêm một chỉ dẫn bổ sung – North Star (ngôi sao Bắc Đẩu).
北极星负责帮团队判断"哪些任务和工作流才是对的"。 North Star chịu trách nhiệm giúp nhóm đánh giá "nhiệm vụ và quy trình nào là đúng".
原文强调了几条纪律: Bài gốc nhấn mạnh một số nguyên tắc:
•北极星永远由人类设定,并扎根于公司的使命与业务目标; • North Star luôn do con người đặt ra, và bám rễ vào sứ mệnh và mục tiêu kinh doanh của công ty;
•北极星一旦被清晰地写下来,人类把它分享给团队里的 agent; • Một khi North Star được viết ra một cách rõ ràng, con người chia sẻ nó cho các agent trong nhóm;
•然后——这一步很关键——人类挑选哪些 agent 应当主动提议新工作流。 • Sau đó – bước này rất quan trọng – con người chọn agent nào nên chủ động đề xuất quy trình làm việc mới.
假定一个运营驱动的产品和公司,那就应该让运营角色来成为主导agent,而非是产品驱动,或者技术驱动,财务驱动。 Giả sử một sản phẩm và công ty do vận hành dẫn dắt, thì nên để vai trò vận hành trở thành agent chủ đạo, chứ không phải do sản phẩm dẫn dắt, hay kỹ thuật dẫn dắt, tài chính dẫn dắt.
就像如何用 Claude 的 Dynamic Workflows 做深度研究中的 路由模式(Classify-And-Act),先由一个 agent 分辨任务类型,再把任务分发给最适合的专门 agent 去做。 Giống như mô hình định tuyến (Classify-And-Act) trong bài viết về cách sử dụng Dynamic Workflows của Claude để nghiên cứu chuyên sâu, đầu tiên một agent phân loại loại nhiệm vụ, sau đó phân phối nhiệm vụ cho agent chuyên biệt phù hợp nhất để thực hiện.
**笔者认为,**之前看 Anthropic 有不少文章,都有提现出在他们眼中什么是 agent ,什么是 workflow? Tác giả cho rằng, trước đây xem nhiều bài viết của Anthropic, đều thể hiện trong mắt họ agent là gì, workflow là gì?
前者则"动态主导自己的流程和工具使用,掌控如何完成任务"。 Loại trước "chủ động nắm quyền kiểm soát quy trình và công cụ của mình một cách linh hoạt, làm chủ cách hoàn thành nhiệm vụ".
而后者 是"通过预定义代码路径编排"的确定性系统; Còn loại sau là hệ thống xác định "được điều phối thông qua các đường dẫn mã được xác định trước";
所以要做ai团队,是应该给 agent 一条北极星而非一张任务清单,正是在有意识地把系统从 workflow 推向 agent。 Vì vậy để xây dựng nhóm AI, nên cung cấp cho agent một North Star thay vì một danh sách nhiệm vụ, chính là có ý thức đẩy hệ thống từ workflow sang agent.
一个有目标的Team会带来一些创造力,而不是在有限的范畴内没事找事。 Một nhóm có mục tiêu sẽ mang lại một số sáng tạo, thay vì kiếm chuyện trong phạm vi hạn chế.
当然,我们现在做的很多ai team,其实是程序化或者ai化workflow,这已经能解决很多问题了,如果我们后续需要的是创意性,自驱的,有主动解决问题能力的,则必须要设计这样agent式的team。 Tất nhiên, nhiều nhóm AI chúng ta đang làm hiện nay thực chất là workflow được lập trình hóa hoặc AI hóa, điều này đã giải quyết được nhiều vấn đề, nếu sau này chúng ta cần tính sáng tạo, tự chủ, có khả năng chủ động giải quyết vấn đề, thì nhất định phải thiết kế nhóm kiểu agent như vậy.
经验四:让agent随时间成长 Kinh nghiệm 4: Để agent trưởng thành theo thời gian
这里官方的数据非常让我惊讶,他说:Anthropic 的工程师已经能让团队里的 agent 独立处理 500 个 bug 修复——但紧接着强调:"things certainly didn't start off that way(一开始绝不是这样)。" Dữ liệu chính thức ở đây khiến tôi rất ngạc nhiên, họ nói: Các kỹ sư của Anthropic đã có thể để agent trong nhóm xử lý độc lập 500 bản sửa lỗi – nhưng ngay sau đó nhấn mạnh: "things certainly didn't start off that way (ban đầu chắc chắn không phải như vậy)."
它把 agent 类比成新入职的人类同事:需要多轮反馈才能把"任务到底怎么做最好"这种隐性知识外显出来。 Họ so sánh agent với đồng nghiệp con người mới vào làm: cần nhiều vòng phản hồi mới có thể ngoại hiện hóa kiến thức ẩn như "cách tốt nhất để thực hiện nhiệm vụ là gì".
用户必须反复用各种任务去试探 agent,才能摸清它的能力边界、如何清晰描述目标、它需要哪些 skill 文件、什么 prompt 最能引出期望行为。 Người dùng phải liên tục thử nghiệm agent với nhiều nhiệm vụ khác nhau để nắm được ranh giới năng lực của nó, cách mô tả mục tiêu rõ ràng, nó cần những file skill nào, prompt nào có thể kích thích hành vi mong muốn nhất.
原文还特别提醒一个容易被忽视的点:模型会升级,任务要重测——prompt 可能要重写,过去有用的护栏(Harness)可能反而会束缚一个更聪明的模型去寻找更有创造力的解法。 Bài gốc còn đặc biệt nhắc nhở một điểm dễ bị bỏ qua: mô hình sẽ được nâng cấp, nhiệm vụ cần được kiểm tra lại – prompt có thể phải viết lại, các rào cản (harness) hữu ích trước đây có thể lại trói buộc một mô hình thông minh hơn tìm kiếm giải pháp sáng tạo hơn.
这条经验里含金量最高的,是关于**验证(verification)**的论述: Điểm có giá trị nhất trong kinh nghiệm này là luận điểm về xác thực (verification):
代码有测试,这是当然的;
Mã có kiểm thử, điều này là đương nhiên;
但大多数其他工作同样可以被验证:技术文档可以套用评分量规(rubric)和风格指南(style guide);
Nhưng hầu hết các công việc khác cũng có thể được xác thực: tài liệu kỹ thuật có thể áp dụng thang đánh giá (rubric) và hướng dẫn phong cách (style guide);
当人类设定好标准、并确保交给 agent 的所有工作都可被审查时,质量就能保持、不偏离初衷;
Khi con người đặt ra tiêu chuẩn, và đảm bảo mọi công việc giao cho agent đều có thể được xem xét, chất lượng có thể được duy trì, không đi chệch hướng ban đầu;
此外,可以让一个 agent 干活、另一个 agent 检查——这就是常说的 "Doer-Verifier"(执行者—验证者)agent harness。
Ngoài ra, có thể để một agent làm việc, một agent khác kiểm tra – đây chính là harness agent "Doer-Verifier" (người thực hiện – người xác thực) thường được nhắc đến.
原文有个完整案例:某位工程负责人接手一个积压(backlog)很重的新团队,他叫上几个人 + 几个 agent 一起梳理优先级。 Bài gốc có một ví dụ hoàn chỉnh: Một trưởng nhóm kỹ thuật tiếp quản một nhóm mới có backlog nặng, anh ấy gọi vài người + vài agent cùng nhau sắp xếp mức độ ưu tiên.
一组 agent 通读所有积压项、判断是否有人在做、给无主项打复杂度分; Một nhóm agent đọc toàn bộ các mục tồn đọng, đánh giá có ai đang làm không, chấm điểm độ phức tạp cho các mục không có chủ;
另一组从清单里筛出中低复杂度项、直接产出代码改动。 Nhóm khác lọc ra các mục có độ phức tạp trung bình và thấp từ danh sách, trực tiếp tạo ra các thay đổi mã.
起初,人类审查 agent 的每一个决策,并标出需要人介入的那些;然后,人类"教会"agent 把这类决策直接抛给人类,确保有艰难权衡的决定永远有"human in the loop"。 Ban đầu, con người xem xét mọi quyết định của agent, và đánh dấu những quyết định cần can thiệp của con người; sau đó, con người "dạy" agent ném trực tiếp các quyết định đó cho con người, đảm bảo các quyết định có sự đánh đổi khó khăn luôn có "human in the loop".
并且每周,团队还让 agent 编一份包含"经验与失误(lessons & missteps)"的周报,让 agent 记住错误、避免重犯。随着时间推移,负责人能交给 agent 越来越复杂的改动,自己花在日常指导上的时间越来越少,如下图: Và hàng tuần, nhóm còn để agent biên soạn một báo cáo tuần bao gồm "bài học và sai lầm (lessons & missteps)", để agent ghi nhớ lỗi, tránh tái phạm. Theo thời gian, người phụ trách có thể giao cho agent những thay đổi ngày càng phức tạp, thời gian dành cho hướng dẫn hàng ngày ngày càng ít, như hình dưới đây:
像极了养聪明龙虾的过程。 Giống hệt quá trình nuôi tôm hùm thông minh.
最后一段是全文我最欣赏的一处洞察——当 agent 变得更独立之后,负责人开始教 agent 把"人类注意力"当作稀缺资源来对待: Đoạn cuối là một nhận thức sâu sắc mà tôi đánh giá cao nhất trong toàn bài – khi agent trở nên độc lập hơn, người phụ trách bắt đầu dạy agent coi "sự chú ý của con người" như một nguồn lực khan hiếm:
比如把问题批量化,让人一次性回答,重复关键上下文,让人快速进入状态,限制一次性丢给人的事项数量。 Ví dụ như batch hóa các câu hỏi, để con người trả lời một lần, lặp lại ngữ cảnh chính, để con người nhanh chóng vào trạng thái, giới hạn số lượng vấn đề ném cho con người một lúc.
有些人甚至专门设一个 agent,唯一职责就是决定如何批处理、并只把最重要的沟通上升给人类。 Một số người thậm chí còn đặt một agent riêng, nhiệm vụ duy nhất là quyết định cách batch xử lý, và chỉ chuyển các giao tiếp quan trọng nhất lên cho con người.
另一些人则给 agent 设"每天最多做多少工作"的护栏——这样人类才来得及有意义地参与,并且保住对自己重要的技能不被荒废。 Một số người khác đặt rào cản "mỗi ngày làm tối đa bao nhiêu công việc" cho agent – để con người có thể tham gia một cách có ý nghĩa, và giữ được các kỹ năng quan trọng của mình không bị mai một.
笔者认为,这些经验是整篇文章在"人机关系"上最深刻的地方。 Tác giả cho rằng, những kinh nghiệm này là phần sâu sắc nhất của toàn bài về "mối quan hệ người-máy".
第一,Anthropic的思想里认为:有效的监督不是审批每一个动作,而是"处在能在关键时刻介入的位置"(being in a position to intervene when it matters)。
Thứ nhất, trong tư tưởng của Anthropic: Giám sát hiệu quả không phải phê duyệt từng hành động, mà là "ở vị trí có thể can thiệp khi cần thiết" (being in a position to intervene when it matters).
第二,把"人类注意力"显式当作稀缺资源去优化,是一个被严重低估的设计原则。大多数关于 agent 的讨论都在优化"agent 的能力",而效率实际的瓶颈已经是"人的认知带宽"了。
Thứ hai, coi "sự chú ý của con người" như một nguồn lực khan hiếm để tối ưu hóa một cách rõ ràng, là một nguyên tắc thiết kế bị đánh giá thấp nghiêm trọng. Hầu hết các cuộc thảo luận về agent đều tập trung vào tối ưu hóa "năng lực của agent", trong khi nút thắt thực sự của hiệu quả đã là "băng thông nhận thức của con người".
第三,Harness驾驭工程是在人机团队里,应该完全模拟高效团队的方式,毕竟有些好马,确实不需要缰绳,只需要目标。
Thứ ba, kỹ thuật harness (điều khiển) trong nhóm người-máy, nên hoàn toàn mô phỏng phương thức của các nhóm hiệu quả, dù sao thì một số con ngựa tốt, thực sự không cần dây cương, chỉ cần mục tiêu.
四、人机协作时代,会无情地放大原团队的组织质量
这篇文章最诚实、也最容易被忽略的一句话出现在结尾: Câu thành thật nhất và cũng dễ bị bỏ qua nhất trong bài viết này xuất hiện ở phần kết:
他说,上面这4条经验其实并不新颖,早在AI出现之前就存在了,好的团队要有强有力的北极星、清晰的角色、扎实的文档、共享的质量标准、从错误中学习的空间,都是我们几十年来就熟知的健康团队习惯。 Ông ấy nói, bốn kinh nghiệm trên thực ra không mới, đã tồn tại từ trước khi AI xuất hiện, một nhóm tốt cần có North Star mạnh mẽ, vai trò rõ ràng, tài liệu vững chắc, tiêu chuẩn chất lượng được chia sẻ, không gian học hỏi từ sai lầm, đều là những thói quen nhóm lành mạnh mà chúng ta đã biết từ nhiều thập kỷ nay.
而AI agent team 只是让这些基本功变得更加重要。 Và nhóm AI agent chỉ làm cho những kỹ năng cơ bản này trở nên quan trọng hơn.
如果没有合理的机制建设,AI 不会自动让团队变强,甚至会造成挤压,最终带来混乱,比如: Nếu không có xây dựng cơ chế hợp lý, AI sẽ không tự động làm nhóm mạnh lên, thậm chí có thể gây ra áp lực, cuối cùng dẫn đến hỗn loạn, ví dụ:
上下文涣散的团队(如靠信息差来管理),接入 agent 后只会更涣散(信息隔绝越大,产出越偏离);
Nhóm có ngữ cảnh phân tán (ví dụ quản lý dựa trên chênh lệch thông tin), sau khi kết nối agent sẽ chỉ càng phân tán hơn (cách ly thông tin càng lớn, đầu ra càng lệch);
角色定位混乱的团队,agent 只会复制混乱,互相工作职责紊乱,决策者判断源失真。
Nhóm có vai trò hỗn loạn, agent sẽ chỉ sao chép sự hỗn loạn, trách nhiệm công việc lẫn lộn, nguồn đánh giá của người ra quyết định bị méo mó.
没有验证文化的团队,agent 的错误会以更快的速度规模化,AI代码的速度已经远超过人的CR速度。
Nhóm không có văn hóa xác thực, lỗi của agent sẽ được mở rộng quy mô với tốc độ nhanh hơn, tốc độ mã AI đã vượt xa tốc độ CR của con người.
因此,笔者认为,"从这波 agent 红利里拿到最多的团队,也是那些最有意识地去践行这些基本功的团队。" Do đó, tác giả cho rằng, "các nhóm nhận được nhiều nhất từ làn sóng lợi ích agent này, cũng là các nhóm có ý thức nhất trong việc thực hành những kỹ năng cơ bản này."
对正在押注 AI agent 的组织来说,这篇文章给出的真正功课,或许不在"怎么用 Claude",而在回头把自己团队的上下文、角色、目标与质量标准这四件旧事,认认真真地重做一遍。 Đối với các tổ chức đang đặt cược vào AI agent, bài tập thực sự mà bài viết này đưa ra, có lẽ không phải ở "cách sử dụng Claude", mà ở quay lại làm lại một cách nghiêm túc bốn việc cũ: ngữ cảnh, vai trò, mục tiêu và tiêu chuẩn chất lượng của nhóm mình.