GPT-5.5「9.7T tham số」được xem xét lại: Sau sửa chữa chỉ còn khoảng 1.5T

robot
Đang tạo bản tóm tắt
Tin tức từ CoinWorld, các nhà nghiên cứu AI Lawrence Chan và Benno Sturgeon đã xem xét lại bài báo của nhà khoa học trưởng Pine AI Li Bojie có tựa đề «Cảm biến kiến thức không thể nén: Ước lượng số lượng tham số của mô hình ngôn ngữ lớn hộp đen dựa trên dung lượng thực tế».
Bài báo gốc ước tính GPT-5.5 khoảng 9.7T, Claude Opus 4.7 khoảng 4.0T, O1 khoảng 3.5T.
Việc xem xét lại chỉ ra rằng, các số liệu ban đầu bị phóng đại do cách đánh giá điểm số và chất lượng đề bài, đặc biệt là cách xử lý «điểm sàn», dẫn đến sự khác biệt trong hiệu suất của mô hình trên các câu hỏi khó bị phóng đại.
Sau khi loại bỏ «điểm sàn», độ dốc phù hợp từ 6.79 giảm xuống còn 3.56, r² giảm từ 0.917 xuống còn 0.815, khoảng dự đoán 90% từ 3.0 lần mở rộng thành 5.7 lần, cho thấy sai số đã tăng lên.
Việc xem xét còn phát hiện 131 câu hỏi có mơ hồ hoặc câu trả lời sai, chiếm 9.4%.
Dựa trên dữ liệu đã chỉnh sửa, số tham số của GPT-5.5 giảm từ 9659B xuống còn 1458B, khoảng dự đoán 90% là từ 256B đến 8311B, các tác giả của bài xem xét nhấn mạnh rằng 1.5T không thể coi là số tham số thực của GPT-5.5.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim