Claude Fable 5 按量收费倒计时，最强模型怎么用才不烧穿账单？

Question

> TL;DR > · Claude Fable 5 已于 7 月 1 日恢复访问，7 月 7 日后更多使用将转向 usage credits。 > · 官方价格为每百万输入 token 10 美元、输出 token 50 美元，长会话和自动循环会放大消耗。 > · 用户更适合把 Fable 5 放在规划和复核环节，执行任务交给更便宜模型。 > > Claude Fable 5 重新开放后，围绕高昂 token 成本的省钱用法成为用户讨论焦点。这个被 Anthropic 称为「most capable widely released model」的旗舰模型，面向高强度推理和长期代理任务，支持 100 万 token 上下文窗口、最高 12.8 万 token 输出。能力提升带来的直接问题是，用户在 Claude Code、Managed Agents 或长会话中，可能让模型持续思考、调用工具、反复检查，账单压力随之放大。 据 Anthropic 官方页面，Claude Fable 5 已于 2026 年 7 月 1 日恢复访问，面向 Pro、Max、Team、Enterprise 用户，以及 Claude Platform、AWS、Google Cloud、Microsoft Foundry 等渠道。官方价格为每百万输入 token 10 美元、每百万输出 token 50 美元，prompt caching 读取价相当于输入价格最高 90% 折扣。 Anthropic 在「Redeploying Fable 5」公告中称，Pro、Max、Team 和部分 Enterprise 用户在 7 月 7 日前，可在最多 50% weekly usage limits 内使用该模型。之后继续使用，将通过 usage credits 计费。 Fable 5 因而不适合被当作默认聊天模型随手打开。它更像一位昂贵的架构师和审稿人，适合在任务开始时定方向，在任务结束前把关，中间大量执行工作则交给更便宜的模型。 最贵的不是一次回答，而是长任务自动跑起来==================== Fable 5 的成本压力先来自单价。 每百万输入 token 10 美元、每百万输出 token 50 美元，让它本身就是高价模型。短问短答时，用户可能感受不明显。但一旦进入代码修改、资料整理、产品方案、研究任务、自动化代理等长链条场景，输出 token、上下文、工具调用和多轮修正都会叠加。 更容易放大消耗的，是 Fable 5 的强项。 官方文档把它定位为适合 long-horizon agentic work，也就是长期代理式工作。它可以把任务拆成多个阶段，主动检查缺口，必要时继续调用工具或子任务推进。对复杂任务来说，这很有价值，用户不必每一步都手动提示，模型可以围绕目标自行迭代。 但如果目标不清、边界太宽、时间太长，模型可能为了把任务做得更完整而持续运行。原文作者称，自己在最初几个小时测试中几乎耗尽使用限制，尽管并没有执行特别夸张的任务。这类体验更像用户反馈，不是官方成本测算，但提醒了一个现实风险：长会话、自动循环和默认误用，都会在 7 月 7 日后更直接地变成 credits 消耗。 「10-80-10」：只在关键两端用 Fable======================== 原文提出的核心方法，是把 Fable 5 从「全程执行者」改成「前后把关者」。 所谓「10-80-10」，大致对应一个 AI 项目的三个阶段。 前 10% 用 Fable 做规划。让它定义任务结构、执行路径、成功标准、约束条件和交付格式。它最适合的不是机械执行，而是在复杂任务开始前搭出清晰方案。 中间 80% 换成更便宜的模型执行。大量 token 通常消耗在反复修改、格式调整、代码小修、资料整理、普通生成和来回迭代中。这部分工作未必需要 Fable 5 全程参与，可以交给 Opus、Sonnet、Haiku，或其他成本更低的模型。 最后 10% 再把 Fable 拉回来复核。等便宜模型完成主要执行后，让 Fable 对照最初计划检查结果是否偏离目标、有没有遗漏、哪些地方需要修补、是否达到发布标准。因为此时它是在审查已有产物，而不是从零生成全部内容，token 消耗通常会低得多。 这个方法不等于官方承诺的省钱公式。原文作者提到，部分场景中，把执行层换成便宜模型可将 token 花费降低 50% 以上，但这更应被理解为使用经验。真正可复制的思路是，高端模型不必承担所有 token 密集型劳动，它更适合放在判断、架构和错误识别环节。 /goal 和 /loop 让代理更好用，也让费用更难察觉============================= Fable 5 的另一个变化，是它更适合代理式工作流。 在传统提示方式里，用户提出问题，模型回答。用户检查后再追问，循环由人推动。每一步是否继续、是否修正、是否停止，都由用户决定。 在 Claude Code 环境中，/goal 和 /loop 把这种流程变成更自动化的执行方式。 Anthropic 文档显示，/goal 会持续运行直到条件满足或用户清除，并可显示 token spend。官方也建议用户加入类似「20 轮后停止」的时间或轮次边界。一个更好的目标不应只是「帮我改代码」，而是说明要完成什么、如何验证结果、哪些限制不能突破、什么时候停止。 /loop 则用于按间隔重复运行 prompt，例如每 5 分钟检查一次部署状态，也可以由 Claude 动态选择间隔。官方文档显示，循环类任务有 7 天过期规则。这类功能适合监控、迭代、检查、长期修复和代理任务，模型可以不等用户反复提示就继续推进。 费用风险也在这里出现。 自动循环把「人类手动确认下一步」改成「模型按计划继续跑」。如果目标过宽、结束条件模糊、间隔设置太密、持续时间太长，Fable 5 可能会在用户离开后继续消耗 token。模型越擅长发现问题、补充步骤和自我检查，越需要用户提前设置硬边界。 因此，10-80-10 和 loop engineering 更适合一起使用：Fable 5 负责设计循环、设定目标和验收标准；执行层尽量交给便宜模型；只有在循环关闭、结果需要判断，或关键节点需要质量把关时，再让 Fable 5 介入。 7 月 7 日后，模型选择和支出上限都要重新检查======================== 对普通用户来说，最直接的风险不是复杂工作流，而是误用。 原文提醒，打开 Claude Code 或 Claude 应用时，模型可能默认选中 Fable。这个说法更像用户经验，官方资料未把它表述为统一规则。但在新模型重新开放、平台鼓励用户测试的阶段，一些用户确实可能在普通聊天、简单整理或低价值任务中无意使用最贵模型。 按 credits 计费开始后，这种误用会更敏感。简单对话、轻量改写、格式整理、普通总结，并不一定需要 Fable 5。每次开始会话前检查模型选择器，可能会成为高频用户的基本动作。 另一个现实提醒是设置 spending cap。 Anthropic 支持文档显示，usage credits 需要在 Settings > Usage 启用，用户可设置支付方式并购买或预充值 credits，同时配置 monthly spending cap、auto-reload 和 usage alerts。Claude Code 也适用 usage credits。 如果没有月度上限，长任务、自动循环和代理式执行可能在短时间内累积明显费用。对高频用户来说，设置月度支出限制、使用提醒，并在 /goal 或 /loop 中写清停止条件，已经不只是财务设置，而是使用代理模型的一部分。 Fable 5 这类模型带来的新习惯，是按任务价值和难度分配模型。规划、复杂判断、最终复核值得用 Fable；重复执行、普通生成和轻量修改，更适合便宜模型。高端模型正在从「更聪明的聊天机器人」变成「可自动工作的代理」，能力越强，越需要用户提前设定目标、边界、时间和预算。否则，账单失控可能比任务失败更早出现。 点击了解律动BlockBeats 在招岗位 **欢迎加入律动 BlockBeats 官方社群：**Telegram 订阅群：https://t.me/theblockbeatsTelegram 交流群：https://t.me/BlockBeats_AppTwitter 官方账号：https://twitter.com/BlockBeatsAsia

Claude Fable 5 按量收费倒计时，最强模型怎么用才不烧穿账单？

最贵的不是一次回答，而是长任务自动跑起来

「10-80-10」：只在关键两端用 Fable

/goal 和 /loop 让代理更好用，也让费用更难察觉

7 月 7 日后，模型选择和支出上限都要重新检查

热门话题

gStocks代币化股票上线

非农爆冷打压加息预期

预测世界杯巴西VS挪威

ETH突破1700

Meta卖算力引发存储股大跌

置顶