Báo cáo chỉ ra rằng, khi sử dụng trí tuệ nhân tạo để lập trình, kiến thức lĩnh vực và khả năng kiểm tra nghiệm là yếu tố quan trọng hơn kỹ năng lập trình. Có khả năng đánh giá chuyên môn và đặt câu hỏi đúng đắn, mới có thể nâng cao tỷ lệ thành công của nhiệm vụ.

Ngày 16 tháng 6, Anthropic công bố báo cáo nghiên cứu 《Agentic coding and persistent returns to expertise》（ mã hóa theo hướng giao phó, bạn ra lệnh, AI tự đọc file và chạy lệnh hoàn thành công việc).

Báo cáo phân tích khoảng 235,000 người dùng và khoảng 400,000 cuộc đối thoại tương tác Claude Code từ tháng 10 năm 2025 đến tháng 4 năm 2026, nhằm trả lời một câu hỏi nhiều người lo lắng: Những người chưa qua đào tạo chính quy về lập trình, có thật sự có thể chỉ huy AI hoàn thành các công việc kỹ thuật phức tạp không?

Báo cáo đưa ra câu trả lời là có, nhưng điều thực sự đáng chú ý là kết luận của báo cáo: Việc có biết lập trình hay không không còn quan trọng bằng việc bạn có hiểu rõ về “vấn đề bạn đang giải quyết” hay không.

“Mọi người đều có thể viết mã”, câu này chỉ đúng một nửa

Trong năm qua, “vibe coding” (viết mã dựa trên cảm giác, bạn dùng ngôn ngữ tự nhiên mô tả mong muốn, AI tự sinh ra mã chạy được, bạn không cần phải hiểu rõ từng dòng) đã trở nên phổ biến trong cộng đồng phát triển. Theo xu hướng này, câu chuyện phổ biến nhất là: ngưỡng cửa để viết mã đã được hạ thấp, ai cũng là kỹ sư.

Ai hưởng lợi nhiều nhất từ câu chuyện này? Các nhà cung cấp công cụ AI, và các ông chủ không cần thuê kỹ sư nữa, đều có lợi. Nhưng dữ liệu trong báo cáo đã chỉnh sửa thành một phiên bản thực tế hơn.

Anthropic đánh giá từng người dùng trong mỗi cuộc đối thoại dựa trên mức độ “từ mới đến chuyên gia” theo năm cấp độ. Cần lưu ý, mức độ chuyên môn này khác với chức danh hay độ thông minh của một người, và đặc biệt là nhiệm vụ cụ thể.

Báo cáo lấy ví dụ quan trọng: Một kế toán chưa từng dùng Python, chỉ cần rõ ràng nói cho Claude biết quy tắc đối soát ra sao, và có thể phát hiện lỗi biên giới bị AI bỏ sót trong quá trình tổng hợp tháng, thì trong nhiệm vụ đó anh ta là chuyên gia; ngược lại, một kỹ sư phần mềm dày dạn hỏi về Rust lần đầu, thì vẫn là người mới.

Nói cách khác, “chuyên môn” ở đây không phải là biết lập trình, mà là bạn hiểu rõ “vấn đề cần giải quyết” đến mức nào. Đó cũng là lý do vì sao việc giảm thiểu thành “mọi người đều có thể thay thế kỹ sư” là hiểu sai, vì kiến thức lĩnh vực chính là dạng đánh giá chuyên môn cần tích lũy lâu dài, không biến mất mà chỉ đổi chỗ thành một điểm nghẽn.

Phân chia công việc như thế nào: bạn đặt câu hỏi, AI trả lời

Hình ảnh rõ ràng nhất trong báo cáo là phân chia quyết định giữa con người và AI. Anthropic chia các quyết định thành “lập kế hoạch” (làm gì, dùng phương pháp nào, thế nào để hoàn thành) và “thực thi” (chỉnh sửa file nào, viết mã gì, dùng ngôn ngữ nào). Kết quả là: trung bình, con người chiếm khoảng 70% các quyết định lập kế hoạch, Claude thực hiện khoảng 80% các quyết định thực thi.

Nguồn hình: Anthropic

Nói dễ hiểu, con người chịu trách nhiệm đặt câu hỏi và kiểm tra, AI đảm nhận phần thực hiện. Và càng người dùng thành thạo, phân chia này càng nghiêng về “buông tay”: báo cáo phát hiện, với người mới, mỗi câu lệnh trung bình kích hoạt khoảng 5 hành động của Claude, tạo ra khoảng 600 từ; còn với chuyên gia, mỗi câu lệnh kích hoạt khoảng 12 hành động, khoảng 3,200 từ. Người trong ngành dám giao nhiều hơn một lần vì họ biết cách mô tả và kiểm tra.

Nguồn hình: Anthropic

Đây là điểm phản trực giác đầu tiên của báo cáo: Càng mạnh AI, khả năng của người trong ngành không bị thu hẹp mà còn được nhân rộng.

Chỉ số thực sự tạo ra khác biệt nằm ở tỷ lệ thành công

Anthropic dùng hai cách để đo lường “cuộc đối thoại này thành công hay không”. Cách rộng nhất là “ít nhất phần nào thành công”; cách nghiêm ngặt hơn gọi là verified success (thành công đã được xác nhận, nghĩa là không chỉ AI tự nhận đã hoàn thành, mà còn có bằng chứng rõ ràng như đẩy mã lên git, chạy thử thành công, hoặc người dùng xác nhận rõ ràng).

Theo tiêu chuẩn nghiêm ngặt nhất: tỷ lệ thành công xác nhận của người mới chỉ là 15%, còn trung cấp đến chuyên gia thì từ 28% đến 33%. Theo tiêu chuẩn rộng hơn, người mới đạt 77%, trung cấp trở lên đạt 91% đến 92%.

Nguồn hình: Anthropic

Tuy nhiên, có một chi tiết đặc biệt được báo cáo nhấn mạnh: phần lớn lợi ích tập trung vào giai đoạn “từ người mới lên trung cấp”, còn từ trung cấp lên chuyên gia thì đường cong gần như phẳng. Theo lời báo cáo, chỉ cần có kiến thức cơ bản về một lĩnh vực, có thể bắt đầu làm việc, thì hầu hết lợi ích đã đạt được, còn đòi hỏi thành thạo sâu hơn chỉ mang lại ít thêm.

Sự khác biệt còn thể hiện ở “ai sẽ giữ vững khi gặp khó khăn”. Khi đối thoại gặp rắc rối (báo lỗi, thử nghiệm thất bại, lặp lại nhiều lần), tỷ lệ bỏ cuộc của người mới là 19%, còn các nhóm khác chỉ 5% đến 7%. Báo cáo giải thích rằng khả năng đưa AI trở lại đúng hướng, chính là một phần của chuyên môn.

Một phát hiện ít ai để ý: sự khác biệt nghề nghiệp, nhỏ hơn bạn nghĩ

Nếu nền tảng lập trình thực sự quan trọng, thì kỹ sư phần mềm phải vượt trội rõ ràng. Nhưng dữ liệu không cho thấy như vậy.

Trong các cuộc đối thoại tạo ra mã, tỷ lệ thành công của các nghề liên quan đến phần mềm là khoảng 34%, các nghề khác là khoảng 29%, chênh lệch chỉ 5 điểm phần trăm, và trong vòng 7 tháng qua, không có xu hướng tăng hay giảm rõ rệt.

Báo cáo đã thống kê top 10 nghề nghiệp trong dữ liệu, mỗi nghề đều có tỷ lệ thành công trong phạm vi 7 điểm phần trăm so với kỹ sư phần mềm. Thật bất ngờ, tỷ lệ thành công của quản lý còn cao hơn một chút so với kỹ sư.

Báo cáo đề cập hai giả thuyết: Một là, kỹ năng “chỉ huy, giao nhiệm vụ, định nghĩa công việc” của quản lý có thể dễ dàng chuyển sang chỉ huy AI; hai là, cách đo lường có thể bị thiên lệch, vì phần lớn thành công dựa vào người dùng rõ ràng xác nhận “đúng vậy”, còn quản lý quen nói rõ ràng hơn.

Trong vòng 7 tháng này, còn có một xu hướng đáng chú ý: tỷ lệ dành thời gian debug (sửa lỗi, sửa hỏng) trong các cuộc đối thoại giảm từ 33% xuống còn 19%, gần như giảm một nửa; ngược lại, hoạt động vận hành phần mềm (triển khai, cấu hình, chạy phần mềm) từ 14% tăng lên 21%, còn viết mã và phân tích dữ liệu từ khoảng 10% tăng gấp đôi lên khoảng 20%.

Báo cáo ước tính giá trị của mỗi nhiệm vụ dựa trên “thị trường nhận thầu” (đây chỉ là so sánh tương đối, không nên coi là con số chính xác), kết quả là giá trị trung bình của nhiệm vụ trong giai đoạn này tăng khoảng 27% (tóm tắt của báo cáo ghi khoảng 25%).

Báo cáo không đề cập, nhưng điều đáng suy nghĩ hơn

Báo cáo thừa nhận có giới hạn: không thể thấy được kết quả thực tế trong thế giới thật, không biết mã sau khi viết ra có được sử dụng hay không; cũng bỏ qua các cách dùng không tương tác (ví dụ như tích hợp Claude Code vào quy trình tự động), vốn chiếm phần lớn. Tất cả phân loại đều dựa trên đánh giá của mô hình qua đọc transcript. Vì vậy, đây chỉ là “bức tranh chụp nhanh” của giai đoạn đầu, chưa phải kết luận cuối cùng.

Điều đáng để các nhà làm công việc trí tuệ tham khảo là phần cuối của báo cáo, nơi đặt ra câu hỏi: Anthropic nói rằng họ sẽ theo dõi liên tục một vấn đề: nếu “lợi ích của kiến thức lĩnh vực” bắt đầu giảm, thì đó chính là lúc mô hình bắt đầu tự cung cấp khả năng đánh giá của chính nó, thay vì phải dựa vào người dùng mang kiến thức đó vào.

Thông điệp của báo cáo là: bạn không cần phải lo lắng về việc “không biết viết mã”, mà đầu tư hiệu quả hơn là làm sâu sắc hơn lĩnh vực của mình, và làm rõ hơn “đúng là gì”.

Hãy hiểu rõ vấn đề trước, rồi mới giao cho AI tăng tốc; kiểm tra nghiệm trước, rồi mới dám buông tay.

Bản dịch được phép đăng lại từ：《數位時代》
Tiêu đề gốc: 《不能只懂寫Code！Anthropic揭Vibe coding真相：比起coding，「本業知識」才是最大槓桿》
Tác giả gốc: 李先泰

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
MyGateTradeStory
1,09M Phổ biến
#
USIranTalksPostponed
20,39M Phổ biến
#
IsraelStrikesIranBTCPlunges
60,81K Phổ biến
#
PredictWorldCup🇺🇸vs🇵🇾
864,21K Phổ biến
#
TradFiCFDGoldMaster
2,07M Phổ biến

Đã ghim

sơ đồ trang web

Chỉ biết Vibe Coding chứ không trở thành chuyên gia! Anthropic tiết lộ sự thật: kiến thức chuyên môn quan trọng hơn việc viết mã

“Mọi người đều có thể viết mã”, câu này chỉ đúng một nửa

Phân chia công việc như thế nào: bạn đặt câu hỏi, AI trả lời

Chỉ số thực sự tạo ra khác biệt nằm ở tỷ lệ thành công

Một phát hiện ít ai để ý: sự khác biệt nghề nghiệp, nhỏ hơn bạn nghĩ

Báo cáo không đề cập, nhưng điều đáng suy nghĩ hơn

Chủ đề thịnh hành

MyGateTradeStory

USIranTalksPostponed

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

TradFiCFDGoldMaster

Đã ghim