Mô hình 27B tham số chạy trên GPU 16GB bộ nhớ, được cho là khả năng suy luận gần bằng Claude 4 Opus

robot
Đang tạo bản tóm tắt

Tin tức ME, 1 tháng 4 (UTC+8), gần đây có thông tin cho rằng một mô hình quy mô 27B tham số khi chạy lượng tử hóa 4-bit trên GPU có bộ nhớ 16GB tại địa phương, trong bài kiểm tra chuẩn SWE-bench đã thể hiện tốt hơn Claude Sonnet 4.5. Theo quan điểm trong bài viết, mô hình này có thể cung cấp năng lực suy luận tương đương với Claude 4 Opus, nhưng yêu cầu tài nguyên thấp hơn. Phiên bản v2 của mô hình này đã giảm 24% sự dư thừa của chuỗi suy nghĩ (chain-of-thought), đồng thời vẫn duy trì độ chính xác HumanEval ở mức 96.91%. (Nguồn: InFoQ)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim