Giai đoạn ác mộng trước khi ra mắt của AI Agent cuối cùng đã được liên kết công cụ kiểm soát một phần

Xem bản gốc
MeNews
LangSmith ra mắt hơn 30 mẫu đánh giá, kiểm tra chất lượng của đại lý AI không còn phải bắt đầu từ đầu nữa
ME News Tin tức, ngày 17 tháng 4 (UTC+8), theo theo dõi của Động sát Beating, công cụ quan sát của nền tảng phát triển đại lý AI LangChain đã phát hành hai cập nhật: thư viện mẫu đánh giá và bộ đánh giá có thể tái sử dụng. Đánh giá xem AI đại lý có "dễ sử dụng" hay không là một trong những bước tiêu tốn nhiều thời gian nhất trong quá trình phát triển. Đại lý có thể gọi đúng công cụ nhưng định dạng câu trả lời không đúng, đối thoại một lượt bình thường nhưng nhiều lượt thì gặp sự cố, câu trả lời cuối cùng có vẻ hợp lý nhưng các bước trung gian đã truy xuất sai tài liệu. Các nhà phát triển cần thiết lập điểm kiểm tra ở nhiều cấp độ khác nhau như từng bước, toàn bộ quá trình, đối thoại nhiều lượt, gọi công cụ cụ thể, và mỗi bộ đánh giá đều phải trải qua quá trình viết hướng dẫn, hiệu chỉnh dựa trên dữ liệu thực tế, điều chỉnh nhiều lần, bắt đầu từ con số không thường mất vài tuần. Hiện tại, LangSmith cung cấp hơn 30 mẫu có sẵn, bao phủ năm loại
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim