📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
Anthropic 终于把 Mythos 模型的安全版 Fable-5 放出来了。
参数这些网上已经讲很多了,我就不重复搬了。更值得看的,其实是第三方编程工具 Augment Code 做的真实任务测试。
这组测试一共跑了 489 个编程任务,结果挺有意思:
Fable-5 在总体表现和正确性上都明显领先。总体分数 +0.224,正确性 +0.191,确实是目前看起来最强的一档。
但另一个细节也很关键:GPT-5.5 依然稳稳压过 Opus-4.8。
总体分数 GPT-5.5 是 +0.164,Opus-4.8 是 +0.128;正确性 GPT-5.5 是 +0.141,Opus-4.8 是 +0.092。
这也解释了我最近的体感:Opus-4.8 出来之后,我并没有明显感觉它比 GPT-5.5 更强,至少在实际编程任务里,这种感觉不是幻觉。
更现实的是成本问题。Fable-5 虽然强,但 Tokens 消耗和成本也高:每个任务约 14.6k tokens,单任务成本 $3.09;相比之下 GPT-5.5 是 7.5k tokens、$1.52。强是真的强,贵也是真的贵。
所以最后还是那句话:期待 GPT-5.6 早点来。
如果 Fable-5 只能在订阅计划里用 10 天,之后就得按 API 原价调用,那它很可能不是普通用户的日常生产力工具,而是少数人、少数场景里的“奢侈品模型”。
AI 模型的使用,可能真的要开始分阶级了。