Открытый исходный код GLM-5.2 по соотношению цена и качество сносит всех, стоимость менее четверти Opus 4.8, а разница в баллах всего 90, эта оценка заставила меня воскликнуть: «Действительно круто!»

Посмотреть Оригинал
CoinNetwork
AA-Briefcase发布:Claude Fable 5夺冠,GLM-5.2挤进前三
Artificial Analysis推出首个面向大模型智能体的长周期知识工作评测基准,涵盖数据科学、产品管理、银行运营与重工业战略四场景,设91项任务,由谷歌、麦肯锡、波士顿咨询专家开发。
结果显示,Claude Fable 5夺冠,Opus 4.8次之,GLM-5.2居前三;但在单项全对标准下,Fable 5的完美率仅3%。
开源GLM-5.2综合分仅比Opus 4.8低90分,成本却不足其25%。
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено