Zhipu GLM-5.2 coroou o primeiro índice inteligente AA de código aberto: pontuação GDPval e GPT-5.5 empatados de igual para igual

robot
Geração do resumo em andamento
De acordo com o monitoramento Beating, o mais recente modelo de ponta MoE da Zhipu AI, GLM-5.2, obteve 51 pontos na avaliação do índice de inteligência de grandes modelos Artificial Analysis v4.1, superando MiniMax-M3 (44 pontos), DeepSeek V4 Pro (máximo, 44 pontos) e Kimi K2.6 (43 pontos), conquistando o topo do ranking global de modelos de código aberto.

No teste GDPval-AA v2, que simula trabalhos de conhecimento do mundo real, o GLM-5.2 obteve 1524 pontos (com base na referência humana de 1000 pontos), liderando MiniMax-M3 (1418 pontos) e DeepSeek V4 Pro (máximo, 1328 pontos), e empatando com o modelo de ponta fechado GPT-5.5 (raciocínio avançado). Em comparação com a geração anterior GLM-5.1, a inferência científica CritPt aumentou 16 pontos percentuais para 21%, o HLE aumentou 12 pontos percentuais para 40%, o TerminalBench v2.1 aumentou 16 pontos percentuais para 78%, e o GPQA Diamond atingiu 89%.

O GLM-5.2 ocupa a melhor relação custo-benefício na fronteira de Pareto de "Inteligência - Custo de Tarefa". Como a saída média por tarefa única é de 43 mil tokens (contra 26 mil tokens do GLM-5.1), o custo médio por tarefa do GLM-5.2 subiu para cerca de US$ 0,46, acima do GLM-5.1 (US$ 0,25) e do DeepSeek V4 Pro (máximo, US$ 0,05), mas ainda muito abaixo de modelos fechados de mesma categoria de inteligência.

O GLM-5.2 possui 744 bilhões de parâmetros, com 40 bilhões de parâmetros ativos, e a janela de contexto foi ampliada de 200 mil para 1 milhão, seguindo a licença MIT para código aberto. Atualmente, a API oficial da Zhipu (preços de entrada de 1,4 e saída de 4,4 / por milhão de tokens) já está disponível em plataformas como SiliconFlow, DeepInfra, Nebius AI e outras.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado