Wenxin 5.1 chính thức ra mắt: tham số giảm xuống còn 1/3 của 5.0, chi phí tiền huấn luyện chỉ bằng 6% của các đối thủ cạnh tranh

Theo giám sát Beating của Động Trắc, mô hình lớn Wenxin của Baidu 5.1 chính thức ra mắt, người dùng có thể trải nghiệm trên trang web chính thức của Wenxin Yiyan, doanh nghiệp và nhà phát triển có thể gọi API qua nền tảng Qiánfán. Wenxin 5.1 dựa trên Wenxin 5.0 được phát hành vào tháng 1 năm nay, điểm bán hàng cốt lõi là nén đáng kể kích thước mô hình và chi phí huấn luyện: tổng số tham số được nén xuống khoảng một phần ba của 5.0, tham số kích hoạt khoảng một nửa, chi phí tính toán tiền huấn luyện chỉ bằng 6% của mô hình cùng quy mô. Chi phí nén đến từ khung huấn luyện linh hoạt Once-for-All do Baidu đề xuất. Phương pháp truyền thống cần chạy huấn luyện trước riêng cho các mô hình quy mô khác nhau, Wenxin 5.0 chỉ cần huấn luyện trước một lần, sau đó có thể tối ưu hóa nhiều mô hình con kích thước khác nhau cùng lúc thông qua lấy mẫu động. Wenxin 5.1 chính là cấu trúc tối ưu được trích xuất từ ma trận mô hình con này, kế thừa trực tiếp kiến thức của 5.0, tiết kiệm công sức tính toán từ việc huấn luyện từ đầu. Trước đó, ngày 30 tháng 4, phiên bản Preview của Wenxin 5.1 đã đạt 1476 điểm trên bảng xếp hạng văn bản LMArena, đứng đầu trong nước. Phiên bản chính thức còn nâng cao thành tích trong các bài kiểm tra chuẩn: điểm thi toán học AIME26 (sử dụng công cụ) đạt 99,6, chỉ sau Gemini-3.1 Pro; khả năng của Agent vượt qua DeepSeek-V4-Pro; bảng xếp hạng tìm kiếm Arena đạt 1223 điểm xếp thứ tư toàn cầu, đứng đầu trong nước.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim