Augment Code thử nghiệm thực tế tác động của AGENTS.md đối với việc tạo mã: tốt nhất tương đương với nâng cấp một bậc mô hình, tệ nhất còn không bằng không viết.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 23 tháng 4 (UTC+8), theo giám sát của Động Sát Beating, công ty công cụ lập trình AI Augment Code đã trích xuất hàng chục tệp AGENTS.md từ monorepo nội bộ, sử dụng bộ đánh giá nội bộ AuggieBench để đo lường tác động thực tế của chúng đối với đầu ra của agent mã hóa. Cách làm là lấy các PR chất lượng cao đã hợp nhất làm chuẩn, cho agent thực hiện lại cùng một nhiệm vụ trong hai điều kiện có và không có AGENTS.md, và so sánh điểm số. Sự chênh lệch lớn hơn nhiều so với dự kiến. AGENTS.md được viết tốt nhất mang lại cải thiện chất lượng tương đương với việc chuyển mô hình từ Haiku sang Opus, còn tệ nhất thì còn tệ hơn cả không có. Hơn nữa, cùng một tệp có thể có tác dụng trái ngược nhau trong các nhiệm vụ khác nhau: nó tăng 25% mức độ tuân thủ quy tắc của một bản sửa lỗi, nhưng lại giảm 30% mức độ hoàn thành của một tính năng phức tạp trong cùng một mô-đun. Có một vài cách viết hiệu quả: tệp chính được kiểm soát trong khoảng 100 đến 150 dòng, kèm theo một vài tài liệu tham khảo tập trung, trong mô-đun trung bình với hàng trăm tệp cốt lõi có thể mang lại cải thiện tổng thể 10% đến 15%. Viết quy trình thành các bước đánh số là hiệu quả nhất, một quy trình triển khai 6 bước đã giảm tỷ lệ PR thiếu tệp từ 40% xuống 10%, độ chính xác tăng 25%. Sử dụng bảng quyết định giúp agent chọn phương án đúng trước khi thực hiện, mức độ tuân thủ quy tắc cũng tăng 25%. Viết lệnh cấm phải kèm theo phương án thay thế, chỉ viết «đừng» sẽ làm agent do dự, và cảnh báo liên tục trên 15 mục sẽ làm hiệu quả xấu đi rõ rệt. Điều dễ thất bại nhất là quá nhiều tài liệu. Khi agent bị kéo vào một lượng lớn tài liệu kiến trúc, sau khi tải hàng trăm nghìn token, đầu ra lại trở nên tồi tệ hơn. Có một mô-đun tích lũy 226 tài liệu vượt quá 2MB, dù AGENTS.md có tốt cũng vô ích. Ngoài ra, AGENTS.md là vị trí tài liệu duy nhất mà agent 100% sẽ đọc, tỷ lệ phát hiện tài liệu không được tham chiếu trong _docs/ dưới 10%. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận