智谱GLM-5.2 đăng quang chỉ số thông minh AA mã nguồn mở hàng đầu: GDPval xếp hạng và GPT-5.5 ngang hàng

robot
Đang tạo bản tóm tắt
Báo cáo của 金色财经, mô hình MoE hàng đầu mới nhất của 智谱 AI GLM-5.2 đã đạt 51 điểm trong đánh giá Chỉ số trí tuệ mô hình lớn Artificial Analysis v4.1, vượt qua MiniMax-M3 (44 điểm), DeepSeek V4 Pro (max, 44 điểm) và Kimi K2.6 (43 điểm), đứng đầu bảng xếp hạng mô hình mã nguồn mở toàn cầu.
Trong bài kiểm tra GDPval-AA v2 mô phỏng công việc kiến thức thế giới thực, GLM-5.2 đạt 1524 điểm (điểm chuẩn của con người là 1000 điểm), dẫn đầu MiniMax-M3 (1418 điểm) và DeepSeek V4 Pro (max, 1328 điểm), ngang hàng với mô hình tiên tiến đóng nguồn GPT-5.5 (xhigh reasoning). So với thế hệ trước GLM-5.1, khả năng suy luận khoa học CritPt tăng 16 điểm phần trăm lên 21%, HLE tăng 12 điểm phần trăm lên 40%, TerminalBench v2.1 tăng 16 điểm phần trăm lên 78%, GPQA Diamond đạt 89%.
GLM-5.2 chiếm vị trí tối ưu về hiệu suất chi phí trong "Trí tuệ - Chi phí nhiệm vụ" trên đường đẳng của Pareto. Do trung bình mỗi nhiệm vụ xuất ra 43k token (so với 26k của GLM-5.1), chi phí trung bình cho mỗi nhiệm vụ của GLM-5.2 tăng lên khoảng 0.46 USD, cao hơn GLM-5.1 (0.25 USD) và DeepSeek V4 Pro (max, 0.05 USD), nhưng vẫn thấp hơn nhiều so với các mô hình cùng cấp trong lĩnh vực trí tuệ nhân tạo đóng nguồn.
GLM-5.2 có tổng tham số 744 tỷ, tham số kích hoạt 40 tỷ, cửa sổ ngữ cảnh từ 200K của thế hệ trước nâng lên 1 triệu, mở mã nguồn theo giấy phép MIT. Hiện tại, API chính thức của 智谱 (giá cả nhập 1.4, xuất 4.4 / mỗi triệu token) đã hoạt động trên các nền tảng như SiliconFlow, DeepInfra, Nebius AI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim