智谱GLM-5.2加冕AA智能指数开源第一:GDPval 跑分与GPT-5.5平起平坐

robot
摘要生成中
金色财经报道,智谱 AI 最新 MoE 旗舰模型 GLM-5.2 在 Artificial Analysis 大模型智能指数 v4.1 评测中斩获 51 分,超越 MiniMax-M3 (44 分)、 DeepSeek V4 Pro (max, 44 分)和 Kimi K2.6 (43 分),登顶全球开源模型榜首。
在模拟真实世界知识工作的 GDPval-AA v2 测试中, GLM-5.2 获 1524 分(人类基准分 1000 分),领先 MiniMax-M3 (1418 分)与 DeepSeek V4 Pro (max, 1328 分),与闭源前沿大模型 GPT-5.5 (xhigh reasoning)平起平坐。相较前代 GLM-5.1,科学推理 CritPt 提升 16 个百分点至 21%, HLE 提升 12 个百分点至 40%, TerminalBench v2.1 提升 16 个百分点至 78%, GPQA Diamond 达 89%。
GLM-5.2 在「智能 - 任务成本」帕累托前沿占据最佳性价比位置。由于单次任务平均输出 43k token (GLM-5.1 为 26k), GLM-5.2 单任务平均成本上升至约 0.46 美元,高于 GLM-5.1 (0.25 美元)和 DeepSeek V4 Pro (max, 0.05 美元),但仍远低于同智能梯队的闭源模型。
GLM-5.2 总参数 744B,激活参数 40B,上下文窗口由前代 200K 升至 1M,遵循 MIT 协议开源。目前,智谱官方 API (定价输入 1.4、输出 4.4 / 每百万 token)与 SiliconFlow、 DeepInfra、 Nebius AI 等平台已上线服务。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论