Tân Lãng khai nguồn mở VibeThinker-3B: suy luận có thể nén, kiến thức thực tế thì không.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 28 tháng 6 (UTC+8), Sina phát hành VibeThinker-3B chỉ với 3B tham số, đạt hiệu suất ngang bằng với các mô hình lớn hơn 200-333 lần như DeepSeek V3.2 trên các chuẩn toán học và lập trình như AIME26, vượt qua tất cả các mô hình dưới 20B trên LiveCodeBench, giải 123/128 bài toán trên LeetCode vượt qua GPT-5.2, Kimi K2.5, v.v. Nhưng GPQA-Diamond chuyên sâu về kiến thức lại tụt hậu đáng kể. Mô hình dựa trên Qwen2.5-Coder-3B của Alibaba, được huấn luyện sau qua nhiều giai đoạn như SFT, học tăng cường, tự chưng cất, v.v. Nghiên cứu đề xuất "giả thuyết nén tham số - bao phủ": suy luận logic phụ thuộc vào một số mẫu có thể nén, trong khi kiến thức thế giới rộng lớn vẫn cần tham số lớn. Mô hình đã được mã nguồn mở. 🔗 Đọc bài gốc:
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim