2026-03-14 16:42:30

τ²-Bench 电信基准测试 (人工分析 )的独立评估摘要，Grok 4.20 得分为96.5%，仅次于 GLM-5 (98.2%，并且在所有西方开发的模型中排名最高 • | Grok 的表现优于： - Gemini 3.1 Pro 预览版 - Claude 4.6 系列 - 所有 GPT 变体 -

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

1人点赞了这条动态

赞赏
1
评论
转发
分享

评论

请输入评论内容

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate广场AI测评官
21.62万热度
#
Gate2月衍生品市场份额创新高
9.85万热度
#
加密市场上涨
44.73万热度
#
比特币站上七万美元
4984.77万热度
#
AAVE换币风波
174.67万热度

热门 Gate Fun
查看更多

1
VKK
美好未来
市值:$2462.06持有人数:1
0.00%
2
cow
MemeCow
市值:$2462.06持有人数:1
0.00%
3
trump
TrumpWin
市值:$0.1持有人数:1
0.00%
4
EMC
EMC
市值:$0.1持有人数:1
0.00%
5
小x
小x
市值:$2458.62持有人数:1
0.00%