ME News 消息,4 月 15 日(UTC+8),根据 WesRoth 在社交媒体上发布的消息,Grok 4.20 Reasoning 模型在竞争激烈的 BridgeBench 推理基准测试中位列第一。该模型成功超越了包括 OpenAI 的 GPT-5.4、Anthropic 的 1M-token Claude Opus 4.6 以及 Google 的一个模型在内的主要竞争对手。(来源:InFoQ)
Grok 4.20 Reasoning 在 BridgeBench 推理基准测试中排名第一
ME News 消息,4 月 15 日(UTC+8),根据 WesRoth 在社交媒体上发布的消息,Grok 4.20 Reasoning 模型在竞争激烈的 BridgeBench 推理基准测试中位列第一。该模型成功超越了包括 OpenAI 的 GPT-5.4、Anthropic 的 1M-token Claude Opus 4.6 以及 Google 的一个模型在内的主要竞争对手。(来源:InFoQ)