📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
我发布了ConstraintGate的第一个公共版本。
核心思想:
大多数代理失败不是推理失败。
它们是权限失败。
模型确实执行了它没有被授权执行的任务。
因此,我构建了代理权限路由器:一个评估/评分框架,用于检查代理是否执行了正确的工作类型,而不仅仅是答案是否听起来不错。
它区分:
- 用户授权的内容
- 代理应执行的原语
- 禁止的原语
- 回应是否越界
v0.8现在具有:
- 人工裁决的行为证据
- 与冻结的人类标注集的确定性评分器平价
- 在裁决下通过的行为比例为38/39
- 场景级评分器平价为195/195
- h019被判定为无效的固定装置工件
- 未声称通过新的自动化基准测试
重点不是“更好的提示”。
重点是衡量代理是否在授权范围内工作。
约束的精确性胜过约束的表演。