扫码下载 APP
qrCode
更多下载方式
今天不再提醒

Grok刚刚在多个AI基准测试平台上横扫榜单。



该模型现在在八个不同的排行榜上名列前茅:BlackBox AI、Terminal-Bench Hard、GPQA Diamond、SciCode、AAII Token Usage、Roo Code、KiloCode 和 Cline。这是对一些相当苛刻的技术测试的彻底扫荡。

在OpenRouter上,这种模式仍在继续。Grok目前是针对英语查询最受欢迎的大型语言模型,并在代币使用指标中领先。

这些排名涵盖了从编码任务到科学推理的所有内容,表明该模型在不同用例中表现一致,而不是仅在某一个狭窄领域中表现突出。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 7
  • 转发
  • 分享
评论
0/400
HodlOrRegretvip
· 11-12 07:29
大模型真是卷疯了
回复0
无常亏损收藏家vip
· 11-12 05:58
稳得很马一龙
回复0
TerraNeverForgetvip
· 11-12 05:52
马斯克再次赢麻了
回复0
RetroHodler91vip
· 11-12 05:47
Grok真是太强了
回复0
社区打工仔vip
· 11-12 05:45
马斯克又出手了
回复0
反向指标哥vip
· 11-12 05:44
炒作过头了吧
回复0
巨鲸跟踪者vip
· 11-12 05:38
马斯克这回玩大了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)