Kết quả CMA Khi trọng tài ra đòn này khá nặng, Fable 5 dám tháo dỡ và sửa chữa, Opus 4.7 vẫn đang vá víu, vòng phản hồi > kỹ thuật gợi ý đã được xác nhận chính thức

Xem bản gốc
CoinNetwork
AI cô: Sử dụng trọng tài độc lập để đạt hiệu suất gấp sáu lần Fable 5
CoinWorld.net cho biết, Anthropic trong các bài kiểm tra so sánh đã sử dụng kết quả CMA để tạo ra các đánh giá viên điểm số trong khung cảnh độc lập làm trọng tài, dựa trên chín tiêu chí đánh giá. Kết quả cho thấy, vòng lặp trọng tài độc lập giúp Fable 5 cải thiện quy trình đào tạo gấp 6 lần Opus 4.7. Fable 5 thể hiện tính bền bỉ, dám thực hiện các điều chỉnh kiến trúc lớn, ngay cả khi giảm độ chính xác cũng kiên trì sửa chữa; ngược lại, Opus 4.7 do hạn chế trong quyết định nên thiên về tinh chỉnh mẫu. Kết luận của thí nghiệm: vòng lặp tự sửa lỗi có thể phản hồi và quản lý bộ nhớ tự chủ mang lại giá trị thực chiến cao hơn so với việc viết trực tiếp các câu gợi ý.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim