Chỉ số thông minh AA của Zhipu GLM-5.2 đứng đầu mã nguồn mở: điểm số GDPval ngang bằng với GPT-5.5

robot
Đang tạo bản tóm tắt
Theo giám sát Beating, mô hình chủ đạo MoE mới nhất của Zhipu AI là GLM-5.2 đã đạt 51 điểm trong đánh giá Chỉ số trí tuệ mô hình lớn của Artificial Analysis v4.1, vượt qua MiniMax-M3 (44 điểm), DeepSeek V4 Pro (tối đa, 44 điểm) và Kimi K2.6 (43 điểm), đứng đầu bảng xếp hạng các mô hình mã nguồn mở toàn cầu.

Trong bài kiểm tra GDPval-AA v2 mô phỏng công việc kiến thức thế giới thực, GLM-5.2 đạt 1524 điểm (điểm chuẩn của con người là 1000 điểm), dẫn đầu MiniMax-M3 (1418 điểm) và DeepSeek V4 Pro (tối đa, 1328 điểm), ngang bằng với mô hình tiên tiến đóng nguồn GPT-5.5 (xhigh reasoning). So với thế hệ trước GLM-5.1, khả năng suy luận khoa học CritPt tăng 16 điểm phần trăm lên 21%, HLE tăng 12 điểm phần trăm lên 40%, TerminalBench v2.1 tăng 16 điểm phần trăm lên 78%, GPQA Diamond đạt 89%.

GLM-5.2 chiếm vị trí tối ưu về hiệu suất chi phí trên đường đẳng của "Trí tuệ - Chi phí nhiệm vụ" Pareto. Do trung bình mỗi nhiệm vụ xuất ra 43k token (so với 26k của GLM-5.1), chi phí trung bình cho mỗi nhiệm vụ của GLM-5.2 tăng lên khoảng 0.46 USD, cao hơn GLM-5.1 (0.25 USD) và DeepSeek V4 Pro (tối đa, 0.05 USD), nhưng vẫn thấp hơn nhiều so với các mô hình cùng cấp độ trí tuệ đóng nguồn.

Tổng số tham số của GLM-5.2 là 744 tỷ, tham số kích hoạt 40 tỷ, cửa sổ ngữ cảnh từ 200K của thế hệ trước nâng lên 1 triệu, mở nguồn theo giấy phép MIT. Hiện tại, API chính thức của Zhipu (giá cả đầu vào 1.4, đầu ra 4.4 / mỗi triệu token) đã hoạt động trên các nền tảng như SiliconFlow, DeepInfra, Nebius AI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim