智譜GLM-5.2加冕AA智能指數開源第一:GDPval跑分與GPT-5.5平起平坐

robot
摘要生成中
據動察 Beating 監測,智譜 AI 最新 MoE 旗艦模型 GLM-5.2 在 Artificial Analysis 大模型智能指數 v4.1 評測中斬獲 51 分,超越 MiniMax-M3 (44 分)、 DeepSeek V4 Pro (max, 44 分)和 Kimi K2.6 (43 分),登頂全球開源模型榜首。

在模擬真實世界知識工作的 GDPval-AA v2 測試中, GLM-5.2 獲 1524 分(人類基準分 1000 分),領先 MiniMax-M3 (1418 分)與 DeepSeek V4 Pro (max, 1328 分),與閉源前沿大模型 GPT-5.5 (xhigh reasoning)平起平坐。相較前代 GLM-5.1,科學推理 CritPt 提升 16 個百分點至 21%, HLE 提升 12 個百分點至 40%, TerminalBench v2.1 提升 16 個百分點至 78%, GPQA Diamond 達 89%。

GLM-5.2 在「智能 - 任務成本」帕累托前沿佔據最佳性價比位置。由於單次任務平均輸出 43k token (GLM-5.1 為 26k), GLM-5.2 單任務平均成本上升至約 0.46 美元,高於 GLM-5.1 (0.25 美元)和 DeepSeek V4 Pro (max, 0.05 美元),但仍遠低於同智能梯隊的閉源模型。

GLM-5.2 總參數 744B,激活參數 40B,上下文窗口由前代 200K 升至 1M,遵循 MIT 協議開源。目前,智譜官方 API (定價輸入 1.4、輸出 4.4 / 每百萬 token)與 SiliconFlow、 DeepInfra、 Nebius AI 等平台已上線服務。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆