✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
Grok 4.20 Beta 在 τ²-Bench 评测中获 97% 准确率,排名第二
ME News 消息,4 月 5 日(UTC+8),近日,Grok 4.20 Beta 版本在 τ²-Bench 评测中取得了 97% 的准确率,排名第二。τ²-Bench 是基于 Sierra 原始 τ-bench 框架构建的评测,以其严苛性著称。该评测不仅测试 AI 能否回答问题,还测试智能体能否成功完成导航任务。(来源:InFoQ)