Tin tức từ CoinWorld, Anthropic đã phát hành BioMysteryBench, một bộ đánh giá chuẩn sinh học gồm 99 câu hỏi. Các câu hỏi do các chuyên gia lĩnh vực biên soạn dựa trên các bộ dữ liệu thực tế (giải trình tự DNA/RNA, học máy protein, metabolomics, v.v.), đáp án dựa trên thuộc tính khách quan của dữ liệu hoặc siêu dữ liệu xác nhận bằng thí nghiệm, không phụ thuộc vào đánh giá chủ quan của nhà nghiên cứu. Trong bài đánh giá, Claude Mythos đã đạt tỷ lệ giải đúng 30% trong 23 câu hỏi khó về con người. Môi trường đánh giá cung cấp cho Claude một container, đã cài đặt sẵn các công cụ sinh học phổ biến, và có thể truy cập các cơ sở dữ liệu công cộng để tải xuống bộ gen tham khảo.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim