Mô hình 27B tham số chạy trên GPU 16GB bộ nhớ, được cho là khả năng suy luận gần bằng Claude 4 Opus

MeNews · 2026-04-01T00:40:18+00:00

Một mô hình có quy mô 27B tham số hoạt động tốt hơn Claude Sonnet 4.5 trong quá trình lượng hóa 4 bit, có khả năng suy luận tương tự nhưng yêu cầu tài nguyên thấp hơn. Phiên bản v2 giảm dư thừa 24%, duy trì độ chính xác HumanEval 96.91%.

MeNews

2026-04-01 00:40:18

Đang tạo bản tóm tắt

Tin tức ME, 1 tháng 4 (UTC+8), gần đây có thông tin cho rằng một mô hình quy mô 27B tham số khi chạy lượng tử hóa 4-bit trên GPU có bộ nhớ 16GB tại địa phương, trong bài kiểm tra chuẩn SWE-bench đã thể hiện tốt hơn Claude Sonnet 4.5. Theo quan điểm trong bài viết, mô hình này có thể cung cấp năng lực suy luận tương đương với Claude 4 Opus, nhưng yêu cầu tài nguyên thấp hơn. Phiên bản v2 của mô hình này đã giảm 24% sự dư thừa của chuỗi suy nghĩ (chain-of-thought), đồng thời vẫn duy trì độ chính xác HumanEval ở mức 96.91%. (Nguồn: InFoQ)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

1 thích