TL;DR · Claude Fable 5 已于 7 月 1 日恢复访问,7 月 7 日后更多使用将转向 usage credits。 · 官方价格为每百万输入 token 10 美元、输出 token 50 美元,长会话和自动循环会放大消耗。 · 用户更适合把 Fable 5 放在规划和复核环节,执行任务交给更便宜模型。
Claude Fable 5 重新开放后,围绕高昂 token 成本的省钱用法成为用户讨论焦点。这个被 Anthropic 称为「most capable widely released model」的旗舰模型,面向高强度推理和长期代理任务,支持 100 万 token 上下文窗口、最高 12.8 万 token 输出。能力提升带来的直接问题是,用户在 Claude Code、Managed Agents 或长会话中,可能让模型持续思考、调用工具、反复检查,账单压力随之放大。
据 Anthropic 官方页面,Claude Fable 5 已于 2026 年 7 月 1 日恢复访问,面向 Pro、Max、Team、Enterprise 用户,以及 Claude Platform、AWS、Google Cloud、Microsoft Foundry 等渠道。官方价格为每百万输入 token 10 美元、每百万输出 token 50 美元,prompt caching 读取价相当于输入价格最高 90% 折扣。
Anthropic 在「Redeploying Fable 5」公告中称,Pro、Max、Team 和部分 Enterprise 用户在 7 月 7 日前,可在最多 50% weekly usage limits 内使用该模型。之后继续使用,将通过 usage credits 计费。
Fable 5 因而不适合被当作默认聊天模型随手打开。它更像一位昂贵的架构师和审稿人,适合在任务开始时定方向,在任务结束前把关,中间大量执行工作则交给更便宜的模型。
Fable 5 的成本压力先来自单价。
每百万输入 token 10 美元、每百万输出 token 50 美元,让它本身就是高价模型。短问短答时,用户可能感受不明显。但一旦进入代码修改、资料整理、产品方案、研究任务、自动化代理等长链条场景,输出 token、上下文、工具调用和多轮修正都会叠加。
更容易放大消耗的,是 Fable 5 的强项。
官方文档把它定位为适合 long-horizon agentic work,也就是长期代理式工作。它可以把任务拆成多个阶段,主动检查缺口,必要时继续调用工具或子任务推进。对复杂任务来说,这很有价值,用户不必每一步都手动提示,模型可以围绕目标自行迭代。
但如果目标不清、边界太宽、时间太长,模型可能为了把任务做得更完整而持续运行。原文作者称,自己在最初几个小时测试中几乎耗尽使用限制,尽管并没有执行特别夸张的任务。这类体验更像用户反馈,不是官方成本测算,但提醒了一个现实风险:长会话、自动循环和默认误用,都会在 7 月 7 日后更直接地变成 credits 消耗。
原文提出的核心方法,是把 Fable 5 从「全程执行者」改成「前后把关者」。
所谓「10-80-10」,大致对应一个 AI 项目的三个阶段。
前 10% 用 Fable 做规划。让它定义任务结构、执行路径、成功标准、约束条件和交付格式。它最适合的不是机械执行,而是在复杂任务开始前搭出清晰方案。
中间 80% 换成更便宜的模型执行。大量 token 通常消耗在反复修改、格式调整、代码小修、资料整理、普通生成和来回迭代中。这部分工作未必需要 Fable 5 全程参与,可以交给 Opus、Sonnet、Haiku,或其他成本更低的模型。
最后 10% 再把 Fable 拉回来复核。等便宜模型完成主要执行后,让 Fable 对照最初计划检查结果是否偏离目标、有没有遗漏、哪些地方需要修补、是否达到发布标准。因为此时它是在审查已有产物,而不是从零生成全部内容,token 消耗通常会低得多。
这个方法不等于官方承诺的省钱公式。原文作者提到,部分场景中,把执行层换成便宜模型可将 token 花费降低 50% 以上,但这更应被理解为使用经验。真正可复制的思路是,高端模型不必承担所有 token 密集型劳动,它更适合放在判断、架构和错误识别环节。
Fable 5 的另一个变化,是它更适合代理式工作流。
在传统提示方式里,用户提出问题,模型回答。用户检查后再追问,循环由人推动。每一步是否继续、是否修正、是否停止,都由用户决定。
在 Claude Code 环境中,/goal 和 /loop 把这种流程变成更自动化的执行方式。
Anthropic 文档显示,/goal 会持续运行直到条件满足或用户清除,并可显示 token spend。官方也建议用户加入类似「20 轮后停止」的时间或轮次边界。一个更好的目标不应只是「帮我改代码」,而是说明要完成什么、如何验证结果、哪些限制不能突破、什么时候停止。
/loop 则用于按间隔重复运行 prompt,例如每 5 分钟检查一次部署状态,也可以由 Claude 动态选择间隔。官方文档显示,循环类任务有 7 天过期规则。这类功能适合监控、迭代、检查、长期修复和代理任务,模型可以不等用户反复提示就继续推进。
费用风险也在这里出现。
自动循环把「人类手动确认下一步」改成「模型按计划继续跑」。如果目标过宽、结束条件模糊、间隔设置太密、持续时间太长,Fable 5 可能会在用户离开后继续消耗 token。模型越擅长发现问题、补充步骤和自我检查,越需要用户提前设置硬边界。
因此,10-80-10 和 loop engineering 更适合一起使用:Fable 5 负责设计循环、设定目标和验收标准;执行层尽量交给便宜模型;只有在循环关闭、结果需要判断,或关键节点需要质量把关时,再让 Fable 5 介入。
对普通用户来说,最直接的风险不是复杂工作流,而是误用。
原文提醒,打开 Claude Code 或 Claude 应用时,模型可能默认选中 Fable。这个说法更像用户经验,官方资料未把它表述为统一规则。但在新模型重新开放、平台鼓励用户测试的阶段,一些用户确实可能在普通聊天、简单整理或低价值任务中无意使用最贵模型。
按 credits 计费开始后,这种误用会更敏感。简单对话、轻量改写、格式整理、普通总结,并不一定需要 Fable 5。每次开始会话前检查模型选择器,可能会成为高频用户的基本动作。
另一个现实提醒是设置 spending cap。
Anthropic 支持文档显示,usage credits 需要在 Settings > Usage 启用,用户可设置支付方式并购买或预充值 credits,同时配置 monthly spending cap、auto-reload 和 usage alerts。Claude Code 也适用 usage credits。
如果没有月度上限,长任务、自动循环和代理式执行可能在短时间内累积明显费用。对高频用户来说,设置月度支出限制、使用提醒,并在 /goal 或 /loop 中写清停止条件,已经不只是财务设置,而是使用代理模型的一部分。
Fable 5 这类模型带来的新习惯,是按任务价值和难度分配模型。规划、复杂判断、最终复核值得用 Fable;重复执行、普通生成和轻量修改,更适合便宜模型。高端模型正在从「更聪明的聊天机器人」变成「可自动工作的代理」,能力越强,越需要用户提前设定目标、边界、时间和预算。否则,账单失控可能比任务失败更早出现。
点击了解律动BlockBeats 在招岗位
欢迎加入律动 BlockBeats 官方社群:
Telegram 订阅群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方账号:https://twitter.com/BlockBeatsAsia
482.16万 热度
107.53万 热度
23.52万 热度
1.52亿 热度
141.48万 热度
Claude Fable 5 按量收费倒计时,最强模型怎么用才不烧穿账单?
Claude Fable 5 重新开放后,围绕高昂 token 成本的省钱用法成为用户讨论焦点。这个被 Anthropic 称为「most capable widely released model」的旗舰模型,面向高强度推理和长期代理任务,支持 100 万 token 上下文窗口、最高 12.8 万 token 输出。能力提升带来的直接问题是,用户在 Claude Code、Managed Agents 或长会话中,可能让模型持续思考、调用工具、反复检查,账单压力随之放大。
据 Anthropic 官方页面,Claude Fable 5 已于 2026 年 7 月 1 日恢复访问,面向 Pro、Max、Team、Enterprise 用户,以及 Claude Platform、AWS、Google Cloud、Microsoft Foundry 等渠道。官方价格为每百万输入 token 10 美元、每百万输出 token 50 美元,prompt caching 读取价相当于输入价格最高 90% 折扣。
Anthropic 在「Redeploying Fable 5」公告中称,Pro、Max、Team 和部分 Enterprise 用户在 7 月 7 日前,可在最多 50% weekly usage limits 内使用该模型。之后继续使用,将通过 usage credits 计费。
Fable 5 因而不适合被当作默认聊天模型随手打开。它更像一位昂贵的架构师和审稿人,适合在任务开始时定方向,在任务结束前把关,中间大量执行工作则交给更便宜的模型。
最贵的不是一次回答,而是长任务自动跑起来
Fable 5 的成本压力先来自单价。
每百万输入 token 10 美元、每百万输出 token 50 美元,让它本身就是高价模型。短问短答时,用户可能感受不明显。但一旦进入代码修改、资料整理、产品方案、研究任务、自动化代理等长链条场景,输出 token、上下文、工具调用和多轮修正都会叠加。
更容易放大消耗的,是 Fable 5 的强项。
官方文档把它定位为适合 long-horizon agentic work,也就是长期代理式工作。它可以把任务拆成多个阶段,主动检查缺口,必要时继续调用工具或子任务推进。对复杂任务来说,这很有价值,用户不必每一步都手动提示,模型可以围绕目标自行迭代。
但如果目标不清、边界太宽、时间太长,模型可能为了把任务做得更完整而持续运行。原文作者称,自己在最初几个小时测试中几乎耗尽使用限制,尽管并没有执行特别夸张的任务。这类体验更像用户反馈,不是官方成本测算,但提醒了一个现实风险:长会话、自动循环和默认误用,都会在 7 月 7 日后更直接地变成 credits 消耗。
「10-80-10」:只在关键两端用 Fable
原文提出的核心方法,是把 Fable 5 从「全程执行者」改成「前后把关者」。
所谓「10-80-10」,大致对应一个 AI 项目的三个阶段。
前 10% 用 Fable 做规划。让它定义任务结构、执行路径、成功标准、约束条件和交付格式。它最适合的不是机械执行,而是在复杂任务开始前搭出清晰方案。
中间 80% 换成更便宜的模型执行。大量 token 通常消耗在反复修改、格式调整、代码小修、资料整理、普通生成和来回迭代中。这部分工作未必需要 Fable 5 全程参与,可以交给 Opus、Sonnet、Haiku,或其他成本更低的模型。
最后 10% 再把 Fable 拉回来复核。等便宜模型完成主要执行后,让 Fable 对照最初计划检查结果是否偏离目标、有没有遗漏、哪些地方需要修补、是否达到发布标准。因为此时它是在审查已有产物,而不是从零生成全部内容,token 消耗通常会低得多。
这个方法不等于官方承诺的省钱公式。原文作者提到,部分场景中,把执行层换成便宜模型可将 token 花费降低 50% 以上,但这更应被理解为使用经验。真正可复制的思路是,高端模型不必承担所有 token 密集型劳动,它更适合放在判断、架构和错误识别环节。
/goal 和 /loop 让代理更好用,也让费用更难察觉
Fable 5 的另一个变化,是它更适合代理式工作流。
在传统提示方式里,用户提出问题,模型回答。用户检查后再追问,循环由人推动。每一步是否继续、是否修正、是否停止,都由用户决定。
在 Claude Code 环境中,/goal 和 /loop 把这种流程变成更自动化的执行方式。
Anthropic 文档显示,/goal 会持续运行直到条件满足或用户清除,并可显示 token spend。官方也建议用户加入类似「20 轮后停止」的时间或轮次边界。一个更好的目标不应只是「帮我改代码」,而是说明要完成什么、如何验证结果、哪些限制不能突破、什么时候停止。
/loop 则用于按间隔重复运行 prompt,例如每 5 分钟检查一次部署状态,也可以由 Claude 动态选择间隔。官方文档显示,循环类任务有 7 天过期规则。这类功能适合监控、迭代、检查、长期修复和代理任务,模型可以不等用户反复提示就继续推进。
费用风险也在这里出现。
自动循环把「人类手动确认下一步」改成「模型按计划继续跑」。如果目标过宽、结束条件模糊、间隔设置太密、持续时间太长,Fable 5 可能会在用户离开后继续消耗 token。模型越擅长发现问题、补充步骤和自我检查,越需要用户提前设置硬边界。
因此,10-80-10 和 loop engineering 更适合一起使用:Fable 5 负责设计循环、设定目标和验收标准;执行层尽量交给便宜模型;只有在循环关闭、结果需要判断,或关键节点需要质量把关时,再让 Fable 5 介入。
7 月 7 日后,模型选择和支出上限都要重新检查
对普通用户来说,最直接的风险不是复杂工作流,而是误用。
原文提醒,打开 Claude Code 或 Claude 应用时,模型可能默认选中 Fable。这个说法更像用户经验,官方资料未把它表述为统一规则。但在新模型重新开放、平台鼓励用户测试的阶段,一些用户确实可能在普通聊天、简单整理或低价值任务中无意使用最贵模型。
按 credits 计费开始后,这种误用会更敏感。简单对话、轻量改写、格式整理、普通总结,并不一定需要 Fable 5。每次开始会话前检查模型选择器,可能会成为高频用户的基本动作。
另一个现实提醒是设置 spending cap。
Anthropic 支持文档显示,usage credits 需要在 Settings > Usage 启用,用户可设置支付方式并购买或预充值 credits,同时配置 monthly spending cap、auto-reload 和 usage alerts。Claude Code 也适用 usage credits。
如果没有月度上限,长任务、自动循环和代理式执行可能在短时间内累积明显费用。对高频用户来说,设置月度支出限制、使用提醒,并在 /goal 或 /loop 中写清停止条件,已经不只是财务设置,而是使用代理模型的一部分。
Fable 5 这类模型带来的新习惯,是按任务价值和难度分配模型。规划、复杂判断、最终复核值得用 Fable;重复执行、普通生成和轻量修改,更适合便宜模型。高端模型正在从「更聪明的聊天机器人」变成「可自动工作的代理」,能力越强,越需要用户提前设定目标、边界、时间和预算。否则,账单失控可能比任务失败更早出现。
点击了解律动BlockBeats 在招岗位
欢迎加入律动 BlockBeats 官方社群:
Telegram 订阅群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方账号:https://twitter.com/BlockBeatsAsia