开源GLM-5.2性价比杀疯了,成本不到Opus 4.8的四分之一,分数却只差90分,这评测看得我直呼真香

币 界 网
AA-Briefcase发布:Claude Fable 5夺冠,GLM-5.2挤进前三
Artificial Analysis推出首个面向大模型智能体的长周期知识工作评测基准,涵盖数据科学、产品管理、银行运营与重工业战略四场景,设91项任务,由谷歌、麦肯锡、波士顿咨询专家开发。结果显示,Claude Fable 5夺冠,Opus 4.8次之,GLM-5.2居前三;但在单项全对标准下,Fable 5的完美率仅3%。开源GLM-5.2综合分仅比Opus 4.8低90分,成本却不足其25%。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论