El GLM-5.2 de código abierto tiene una relación calidad-precio increíble, el costo es menos de una cuarta parte de Opus 4.8, pero la diferencia de puntuación es solo de 90 puntos, esta evaluación me hizo exclamar "¡Qué impresionante!"

Ver original
CoinNetwork
AA-Bolsa de trabajo publica: Claude Fable 5 gana el campeonato, GLM-5.2 se cuela en el podio
Artificial Analysis lanza su primer estándar de evaluación de conocimiento a largo plazo para agentes de modelos grandes inteligentes, que abarca cuatro escenarios: ciencia de datos, gestión de productos, operaciones bancarias y estrategias de industrias pesadas, con 91 tareas desarrolladas por expertos de Google, McKinsey y Boston Consulting. Los resultados muestran que Claude Fable 5 ganó, Opus 4.8 quedó en segundo lugar, y GLM-5.2 estuvo entre los tres primeros; pero bajo el estándar de respuesta perfecta en cada ítem, la tasa de perfección de Fable 5 es solo del 3%. La puntuación total del código abierto GLM-5.2 solo es 90 puntos menor que Opus 4.8, pero su costo es menos del 25%.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado