Zhipu GLM-5.2 coroou o índice inteligente AA como o primeiro de código aberto: pontuação GDPval e GPT-5.5 estão no mesmo nível

robot
Geração de resumo em curso
De acordo com o monitoramento Beating, o mais recente modelo de ponta MoE da Zhipu AI, GLM-5.2, obteve 51 pontos na avaliação do índice de inteligência de grandes modelos Artificial Analysis v4.1, superando o MiniMax-M3 (44 pontos), DeepSeek V4 Pro (máximo, 44 pontos) e Kimi K2.6 (43 pontos), conquistando o topo da lista de modelos de código aberto globais.

No teste GDPval-AA v2, que simula trabalhos de conhecimento do mundo real, o GLM-5.2 obteve 1524 pontos (com base na referência humana de 1000 pontos), liderando o MiniMax-M3 (1418 pontos) e o DeepSeek V4 Pro (máximo, 1328 pontos), e empatando com o modelo de ponta fechado GPT-5.5 (raciocínio avançado). Em comparação com a geração anterior, o GLM-5.1, a inferência científica CritPt aumentou 16 pontos percentuais para 21%, o HLE aumentou 12 pontos percentuais para 40%, o TerminalBench v2.1 aumentou 16 pontos percentuais para 78%, e o GPQA Diamond atingiu 89%.

O GLM-5.2 ocupa a melhor relação custo-benefício na fronteira de Pareto de "Inteligência - Custo de Tarefa". Como a saída média por tarefa única é de 43 mil tokens (contra 26 mil do GLM-5.1), o custo médio por tarefa do GLM-5.2 subiu para cerca de 0,46 dólares, superior ao GLM-5.1 (0,25 dólares) e ao DeepSeek V4 Pro (máximo, 0,05 dólares), mas ainda muito inferior aos modelos fechados da mesma categoria de inteligência.

O GLM-5.2 possui 744 bilhões de parâmetros totais, 40 bilhões de parâmetros ativos, e a janela de contexto foi ampliada de 200 mil para 1 milhão, seguindo a licença MIT de código aberto. Atualmente, a API oficial da Zhipu (preços de entrada de 1,4 e saída de 4,4 por milhão de tokens) já está disponível em plataformas como SiliconFlow, DeepInfra, Nebius AI, entre outras.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado