Zhipu GLM-5.2 coronado como el primer índice inteligente abierto AA: puntuaciones de GDPval y GPT-5.5 a la par

robot
Generación de resúmenes en curso

Según la monitorización de Beating, el último modelo insignia MoE de Zhipu AI, GLM-5.2, obtuvo 51 puntos en la evaluación de Artificial Analysis Large Model Intelligence Index v4.1, superando a MiniMax-M3 (44 puntos), DeepSeek V4 Pro (máximo, 44 puntos) y Kimi K2.6 (43 puntos), alcanzando la cima en la lista de modelos de código abierto a nivel mundial.

En la prueba GDPval-AA v2, que simula trabajos de conocimiento del mundo real, GLM-5.2 obtuvo 1524 puntos (con una referencia humana de 1000 puntos), liderando a MiniMax-M3 (1418 puntos) y DeepSeek V4 Pro (máximo, 1328 puntos), y empatando con el modelo de vanguardia cerrado GPT-5.5 (razonamiento xhigh). En comparación con la versión anterior GLM-5.1, la inferencia científica CritPt mejoró en 16 puntos porcentuales hasta el 21%, HLE aumentó en 12 puntos porcentuales hasta el 40%, TerminalBench v2.1 subió en 16 puntos porcentuales hasta el 78%, y GPQA Diamond alcanzó el 89%.

GLM-5.2 ocupa la mejor relación calidad-precio en la frontera de Pareto de "Inteligencia - Costo de tarea". Debido a que la salida promedio por tarea es de 43k tokens (frente a 26k de GLM-5.1), el costo promedio por tarea de GLM-5.2 aumentó a aproximadamente 0.46 dólares, por encima de GLM-5.1 (0.25 dólares) y DeepSeek V4 Pro (máximo, 0.05 dólares), pero aún mucho menor que otros modelos de la misma categoría inteligente.

GLM-5.2 tiene 744 mil millones de parámetros en total, 40 mil millones de parámetros activos, y la ventana de contexto se amplió de 200K a 1M en comparación con la versión anterior, siguiendo la licencia MIT de código abierto. Actualmente, la API oficial de Zhipu (precio de entrada 1.4, salida 4.4 / por millón de tokens) ya está en servicio en plataformas como SiliconFlow, DeepInfra, Nebius AI y otras.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado