Zhipu GLM-5.2 coroou o primeiro índice inteligente AA de código aberto: GDPval pontuação e GPT-5.5 empatados em igualdade

robot
Geração do resumo em andamento
Golden Finance报道,Zhipu AI 最新MoE旗舰模型GLM-5.2在Artificial Analysis大模型智能指数v4.1评测中斩获51分,超越MiniMax-M3(44分)、DeepSeek V4 Pro(max,44分)和Kimi K2.6(43分),登顶全球开源模型榜首。
在模拟真实世界知识工作的GDPval-AA v2测试中,GLM-5.2获1524分(人类基准分1000分),领先MiniMax-M3(1418分)与DeepSeek V4 Pro(max,1328分),与闭源前沿大模型GPT-5.5(xhigh reasoning)平起平坐。相较前代GLM-5.1,科学推理CritPt提升16个百分点至21%,HLE提升12个百分点至40%,TerminalBench v2.1提升16个百分点至78%,GPQA Diamond达89%。
GLM-5.2在「智能 - 任务成本」帕累托前沿占据最佳性价比位置。由于单次任务平均输出43k token(GLM-5.1为26k),GLM-5.2单任务平均成本上升至约0.46美元,高于GLM-5.1(0.25美元)和DeepSeek V4 Pro(max,0.05美元),但仍远低于同智能梯队的闭源模型。
GLM-5.2总参数744B,激活参数40B,上下文窗口由前代200K升至1M,遵循MIT协议开源。目前,智谱官方API(定价输入1.4、输出4.4/每百万token)与SiliconFlow、DeepInfra、Nebius AI等平台已上线服务。
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado