Nghiên cứu của Anthropic: Chuyên môn lĩnh vực quan trọng hơn khả năng lập trình trong quyết định hiệu quả tạo mã của Claude Code

Phân tích của Anthropic sau khoảng 400.000 phiên tương tác Claude Code, khoảng 235.000 người dùng phát hiện:
Chìa khóa thành bại của AI coding không phải là có biết lập trình hay không, mà là độ hiểu biết sâu sắc về lĩnh vực của vấn đề cần giải quyết.
(Tiền đề: Anthropic phát hành nghiên cứu về Claude Code kinh tế! Tiềm năng tiết kiệm chi phí của AI lên tới 4 tỷ đô la)
(Bổ sung nền: Anthropic ra mắt bảng điều khiển tác động của AI: Nhập nghề nghiệp, giây lát kiểm tra xem công việc của bạn bị AI chiếm bao nhiêu?)

Mục lục bài viết

Toggle

  • Một kế toán, làm thế nào để trở thành "chuyên gia" trong mắt Claude
  • Sau sai sót, ai có thể kéo agent trở lại đúng hướng
  • Quản lý thắng lập trình viên, sự khác biệt nghề nghiệp gần như biến mất

Trong báo cáo nghiên cứu mới nhất, Anthropic đã phân tích mẫu của khoảng 235.000 người dùng và phát hiện ra rằng, yếu tố quyết định thành bại của hiệu quả AI chính là người "ra lệnh" hiểu rõ vấn đề mình đang giải quyết đến mức nào.

Một kế toán, làm thế nào để trở thành "chuyên gia" trong mắt Claude

Nghiên cứu của Anthropic bao gồm khoảng 400.000 phiên Claude Code từ tháng 10 năm 2025 đến tháng 4 năm 2026.

Báo cáo xây dựng một bộ "thang đo trình độ chuyên môn theo nhiệm vụ năm cấp độ", từ mới bắt đầu đến chuyên gia. Điểm mấu chốt là cách định nghĩa "chuyên môn" này khác với bạn nghĩ. Nói đơn giản là: Bạn hiểu rõ vấn đề bạn cần giải quyết đến mức nào, chứ không phải bạn có giỏi viết code hay không.

Ví dụ được đưa ra rất rõ ràng: Một kỹ sư phần mềm dày dạn lần đầu viết Rust, trong nhiệm vụ đó xem như mới bắt đầu; ngược lại, một kế toán chưa từng dùng Python, chỉ cần có thể chính xác chỉ rõ cho Claude các điều kiện cần thỏa mãn trong quy tắc đối soát, và phát hiện lỗi logic trong biên bản tháng, thì trong nhiệm vụ đó là chuyên gia.

Khoảng cách về số liệu trực tiếp phản ánh mức độ nghiêm trọng của vấn đề. Phiên mới bắt đầu trung bình mỗi prompt kích hoạt khoảng 5 hành động của Claude, tạo ra khoảng 600 từ; phiên của chuyên gia kích hoạt khoảng 12 hành động, tạo ra khoảng 3.200 từ, tức là gấp hơn 2 lần hành động và gấp 5 lần nội dung so với người mới bắt đầu.

Phân tích hồi quy của Anthropic cho thấy, mỗi cấp độ chuyên môn tăng lên, số hành động của Claude tăng khoảng 9%, sản phẩm đầu ra tăng khoảng 13%, và mối quan hệ này vẫn giữ vững khi kiểm soát loại công việc, giá trị nhiệm vụ, tháng, nghề nghiệp và phiên bản mô hình.

Sau sai sót, ai có thể kéo agent trở lại đúng hướng

Tỷ lệ thành công còn thể hiện rõ hơn nữa. Anthropic đã định nghĩa hai tiêu chuẩn thành công: "Đánh giá thành công" (bộ phân loại sau khi đọc xong cuộc trò chuyện sẽ xác định xem có đạt mục tiêu hay không) và "Xác nhận thành công" (cần có bằng chứng rõ ràng để kiểm chứng, ví dụ qua thử nghiệm, commit git, xác nhận rõ ràng của người dùng).

Nói chung, độ chuyên nghiệp của người dùng càng cao, khả năng thành công của phiên càng lớn, và phần lớn sự gia tăng này tập trung ở mức thấp của thang đo, sự chênh lệch giữa mới bắt đầu và trung cấp lớn hơn nhiều so với từ trung cấp lên chuyên gia. Anthropic phát hiện, tỷ lệ xác nhận thành công của phiên ở cấp độ chuyên gia gấp hơn hai lần so với người mới bắt đầu.

Điều thú vị hơn nữa là "tỷ lệ sửa lỗi sau khi gặp sai sót". Anthropic đã theo dõi các phiên gặp rắc rối, tức là các cuộc trò chuyện có tín hiệu thất bại. Trong số này, tỷ lệ xác nhận thành công từ người mới bắt đầu là 4%, lên tới 15% ở cấp độ chuyên gia; tỷ lệ thành công ít nhất một phần là 60% ở người mới, 80-81% ở trung cấp đến chuyên gia.

Khoảng cách bỏ cuộc cũng rõ rệt. Khi phiên gặp khó khăn, người mới có tới 19% khả năng bỏ cuộc ngay lập tức (đánh giá thất bại và không có mã nào), trong khi các cấp độ khác chỉ khoảng 5-7%. Phân tích của Anthropic cho rằng, một trong những giá trị của lĩnh vực chuyên môn chính là khả năng dẫn dắt agent trở lại đúng hướng khi nó đi lệch.

Phát hiện này dẫn đến một kết luận phản trực giác: "Hiểu vấn đề" còn quan trọng hơn "hiểu công cụ". Bởi vì, hiểu vấn đề mới giúp biết chính xác chỗ sai khi Claude đưa ra câu trả lời sai; mới có thể xác định rõ ràng các điều kiện biên; mới có thể lập tức chỉnh sửa khi agent quyết định kỳ quặc.

Quản lý thắng lập trình viên, sự khác biệt nghề nghiệp gần như biến mất

Dữ liệu của Anthropic đã phá vỡ một giả định khác: nền tảng nghề nghiệp không quan trọng như ta nghĩ.

Tỷ lệ xác nhận thành công của các nghề liên quan đến phần mềm trung bình khoảng 30%, các nghề khác khoảng 26%. Chỉ xem các phiên "có tạo ra mã" thực tế, chênh lệch mở rộng thành 34% so với 29%, nhưng nếu mở rộng đến "ít nhất phần nào thành công", hai nhóm gần như ngang nhau: 89% so với 88%.

Điều đáng chú ý hơn nữa là trong top 10 nghề nghiệp, mỗi nghề đều có tỷ lệ xác nhận thành công trong phạm vi 7 điểm phần trăm so với nghề lập trình viên. Quản lý còn có tỷ lệ thành công cao hơn một chút so với lập trình viên, và giả thuyết của Anthropic là: Quản lý quen chỉ đạo nhiệm vụ và thiết lập quy chuẩn, điều này dễ dàng chuyển sang việc chỉ huy agent.

Hình thức công việc cũng thay đổi nhanh chóng trong vòng bảy tháng. Phiên sửa lỗi chiếm tỷ lệ giảm từ 33% xuống còn 19%, gần như giảm một nửa; thao tác phần mềm (triển khai, cấu hình, chạy pipeline) từ 14% tăng lên 21%; viết lách và phân tích dữ liệu khoảng từ 10% tăng gấp đôi lên 20%.

Nói cách khác, người dùng đang sử dụng Claude Code cho ngày càng nhiều công việc "xung quanh lập trình" hơn là chỉ viết mã.

Giá trị kinh tế của nhiệm vụ cũng tăng theo. Anthropic ước tính giá trị thị trường trung bình của mỗi phiên dựa trên giá thầu freelance, trong vòng bảy tháng tăng khoảng 27%; nhiệm vụ xây dựng tăng khoảng 43%, thao tác tăng khoảng 34%, sửa lỗi tăng khoảng 32%.

Anthropic đã đề xuất một khung khái niệm đáng nhớ trong phần kết của báo cáo: Lợi ích đến từ "năng lực, chứ không phải thành thạo", đơn giản là "kiến thức đủ dùng", không cần phải thành thạo sâu sắc.

Chỉ cần có hiểu biết cơ bản đến trung bình về một lĩnh vực, bạn đã có thể hưởng phần lớn lợi ích; từ trung cấp lên chuyên gia, tỷ lệ thành công sẽ giảm dần rõ rệt.

Cùng với sự mở rộng liên tục của công cụ AI, nó không làm tăng kỹ năng lập trình của bạn, mà là độ hiểu biết sâu sắc về vấn đề của bạn. Những người không hiểu rõ mình cần giải quyết vấn đề gì, dù dùng mô hình mạnh hơn cũng chỉ đang đi lạc nhanh hơn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim