Ảnh hưởng của việc thử nghiệm AGENTS.md trong Augment Code đối với việc tạo mã: tốt nhất tương đương với nâng cấp một bậc mô hình, tệ nhất là không bằng không viết.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 23 tháng 4 (UTC+8), theo giám sát của Beating, công ty công cụ lập trình AI Augment Code đã trích xuất hàng chục tệp AGENTS.md từ monorepo của mình, sử dụng bộ đánh giá nội bộ AuggieBench để đo lường tác động thực tế của chúng đối với kết quả của các tác nhân mã hóa. Cách làm là lấy các PR chất lượng cao đã được hợp nhất làm chuẩn, yêu cầu tác nhân thực hiện lại cùng một nhiệm vụ trong hai điều kiện có và không có AGENTS.md, sau đó so sánh điểm số. Sự khác biệt lớn hơn nhiều so với dự kiến. AGENTS.md được viết tốt nhất mang lại sự cải thiện chất lượng tương đương với việc thay đổi mô hình từ Haiku sang Opus, còn AGENTS.md viết tệ nhất còn tệ hơn cả không có. Và cùng một tệp có thể có tác dụng ngược lại trong các nhiệm vụ khác nhau: nó giúp tăng 25% mức độ tuân thủ quy tắc sửa lỗi, nhưng lại làm giảm 30% mức độ hoàn thành của một chức năng phức tạp trong cùng một mô-đun. Có một vài cách viết hiệu quả: tệp chính giới hạn trong 100 đến 150 dòng, kèm theo một vài tài liệu tham khảo tập trung, trong các mô-đun vừa phải với hàng trăm tệp cốt lõi có thể mang lại sự cải thiện tổng thể từ 10% đến 15%. Viết quy trình dưới dạng các bước đánh số là hiệu quả nhất, một quy trình triển khai 6 bước đã giảm tỷ lệ PR thiếu tệp từ 40% xuống 10%, độ chính xác tăng 25%. Sử dụng bảng quyết định giúp tác nhân chọn đúng phương án trước khi hành động, mức độ tuân thủ quy tắc cũng tăng 25%. Khi viết lệnh cấm, phải kèm giải pháp thay thế, chỉ viết "đừng" sẽ khiến tác nhân do dự, hơn 15 cảnh báo liên tiếp sẽ làm xấu đi rõ rệt. Điều dễ gây thất bại nhất là quá nhiều tài liệu. Một khi tác nhân bị lôi vào một lượng lớn tài liệu kiến trúc, sau khi tải hàng trăm nghìn token, kết quả lại trở nên tệ hơn. Có một mô-đun tích lũy 226 tài liệu với hơn 2MB, dù AGENTS.md viết hay cũng vô dụng. Ngoài ra, AGENTS.md là vị trí tài liệu duy nhất mà tác nhân 100% sẽ đọc, tỷ lệ phát hiện các tài liệu không được tham chiếu dưới thư mục _docs/ là dưới 10%. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận