Thông báo của Trang web Coinjie cho biết, Lawrence Chan và các người khác đã chỉ ra trong việc xem xét lại bài báo của Li Bojie rằng, ước tính ban đầu đã phóng đại điểm số, đặc biệt là cách xử lý điểm sàn không phù hợp, dẫn đến việc đánh giá hiệu suất các câu hỏi khó bị đánh giá quá cao. Sau khi loại bỏ, hệ số góc phù hợp giảm xuống còn 3.56, khoảng tin cậy 90% mở rộng, sai số tăng lên; có 9.4% các câu hỏi trong số 131 câu có mơ hồ hoặc sai sót. Sau khi sửa đổi, tham số của GPT-5.5 giảm từ 9659 tỷ xuống còn 1458 tỷ, phạm vi dự đoán là 256 tỷ – 8311 tỷ, nhấn mạnh rằng 1.5T không thể xem là số lượng tham số thực sự.

CoinNetwork

2026-05-02 12:01:02

Đang tạo bản tóm tắt

Tin tức từ CoinWorld, các nhà nghiên cứu AI Lawrence Chan và Benno Sturgeon đã xem xét lại bài báo của nhà khoa học trưởng Pine AI Li Bojie có tựa đề «Cảm biến kiến thức không thể nén: Ước lượng số lượng tham số của mô hình ngôn ngữ lớn hộp đen dựa trên dung lượng thực tế».
Bài báo gốc ước tính GPT-5.5 khoảng 9.7T, Claude Opus 4.7 khoảng 4.0T, O1 khoảng 3.5T.
Việc xem xét lại chỉ ra rằng, các số liệu ban đầu bị phóng đại do cách đánh giá điểm số và chất lượng đề bài, đặc biệt là cách xử lý «điểm sàn», dẫn đến sự khác biệt trong hiệu suất của mô hình trên các câu hỏi khó bị phóng đại.
Sau khi loại bỏ «điểm sàn», độ dốc phù hợp từ 6.79 giảm xuống còn 3.56, r² giảm từ 0.917 xuống còn 0.815, khoảng dự đoán 90% từ 3.0 lần mở rộng thành 5.7 lần, cho thấy sai số đã tăng lên.
Việc xem xét còn phát hiện 131 câu hỏi có mơ hồ hoặc câu trả lời sai, chiếm 9.4%.
Dựa trên dữ liệu đã chỉnh sửa, số tham số của GPT-5.5 giảm từ 9659B xuống còn 1458B, khoảng dự đoán 90% là từ 256B đến 8311B, các tác giả của bài xem xét nhấn mạnh rằng 1.5T không thể coi là số tham số thực của GPT-5.5.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
TradfiTradingChallenge
239.47K Phổ biến
#
HYPEOutperformsAgain
16.33M Phổ biến
#
IsraelStrikesIranBTCPlunges
48.54K Phổ biến
#
#DailyPolymarketHotspot
1.02M Phổ biến
#
GateSquarePizzaDay
1.71M Phổ biến

Đã ghim

sơ đồ trang web

GPT-5.5「9.7T tham số」được xem xét lại: Sau sửa chữa chỉ còn khoảng 1.5T

Chủ đề thịnh hành

TradfiTradingChallenge

HYPEOutperformsAgain

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Đã ghim