✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
斯坦福AI实验室发布通用验证框架LLM-as-a-Verifier,在两项基准测试中达SOTA
ME News 消息,4 月 10 日(UTC+8),斯坦福AI实验室(StanfordAILab)近日发布了一个名为"LLM-as-a-Verifier"的通用验证框架。该框架通过扩展评分粒度、重复验证和标准分解等方法,在Terminal-Bench 2基准测试中取得了86.4%的准确率,在SWE-Bench Verified基准测试中取得了77.8%的准确率,均达到了当前最优水平(SOTA)。文中提供了相关博客和代码的链接。(来源:InFoQ)