GLM-5.1 obtiene el primer lugar en código abierto en LMArena y el tercer lugar a nivel mundial

robot
Generación de resúmenes en curso

Según la monitorización de 1M AI News, hoy la plataforma de evaluación de IA de autoridad mundial LMArena (con la participación de millones de usuarios en pruebas a ciegas) actualizó la lista especial de Code Arena, donde GLM-5.1 encabeza el primer lugar en modelos de código abierto a nivel mundial, y ocupa el tercer puesto en modelos globales.
GLM-5.1 no solo hereda la capacidad de codificación SOTA de código abierto de la generación anterior, sino que también ha logrado avances en tareas de largo plazo (Long-Horizon Task), logrando:

  1. Construir un escritorio Linux desde cero en 8 horas;
  2. Romper el cuello de botella en la optimización de bases de datos vectoriales con 655 iteraciones;
  3. Optimizar la carga de modelos de aprendizaje automático reales con 1000 rondas de llamadas a herramientas.
    Cabe destacar que, bajo los mismos estándares de evaluación en la lista METR, GLM-5.1 es el único modelo de código abierto que logra trabajo continuo durante 8 horas, y es uno de los pocos modelos en todo el mundo, además de Claude Opus 4.6, que posee esta capacidad.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado