GPT 5.6 Sol、Terra、Luna懒人包:特色、定价一次看,跟Claude比较哪家强?

OpenAI发布GPT-5.6系列模型,本文带你看Sol、Terra 与 Luna 模型家族特色、计费、API费用一览。不过因应川普政府安全审查要求,目前仅限特定合作伙伴限量预览。

GPT 5.6闪电发布,受川普政府要求限制存取

OpenAI在 6 月 26 日惊喜发表新一代 GPT-5.6 模型系列,包含了旗舰模型 Sol、平衡型模型 Terra 以及高 CP 值模型 Luna。

然而,受到川普政府对尖端 AI 模型实施安全审查的要求,**OpenAI 目前仅针对少数受信任的合作伙伴开放限量预览版,而暂时不在 ChatGPT 中提供,未来将逐步开放。**尽管如此,GPT-5.6、OpenAI 预览版、Sol、Terra 与 Luna 的的突袭推出,仍成为科技界热门搜寻关键字。

GPT 5.6三大模型差异:Sol、Terra、Luna

GPT-5.6 系列在命名系统上做出了重大修正,舍弃了过去常见的 nano 或 mini 等名称。OpenAI 表示,新命名系统中的数字代表模型的世代,而 Sol、Terra、Luna 则代表各自独立发展的持久能力层级,目的是让企业与开发者在智慧表现、速度与成本之间有更清晰的选择。

虽然对于币圈人来说,Sol 很容易让人联想到 Layer 1 公链Solana($SOL),Terra 跟 Luna 则让人想到同名的已归零项目Terra($LUNA),但这三大模型跟区块链或加密货币毫无关系,Sol 在拉丁文的意思是月亮、Terra 则意指地球、Luna 则是月球。

这三款模型针对不同的企业需求设计:

  • Sol 是最高阶的旗舰选项,专为复杂推理、延伸编码、进阶智慧体驱动工作流以及网络安全防御等最具挑战性的任务而建构
  • Terra 则在强大性能与效率之间取得平衡,适合需要处理大量工作(如客户支援、内部工具和文件分析)且希望控制成本的生产环境
  • Luna 则是家族中最轻量、最具成本效益的选择,优化了速度与日常常规自动化任务。

GPT 5.6 Sol、Terra、Luna计费:API费用差异

在价格方面,GPT-5.6 依据三种模型大小以每100万个 Token 计价,详细定价与定位如下表所示(手机版可左右滑动表格):

| 模型 | 定位 | 每 100 万 Token 输入 | 每 100 万 Token 输出 | | --- | --- | --- | --- | | GPT-5.6 Sol | 旗舰模型,适合高阶推理、Agent、安全研究 | 5 美元 | 30 美元 | | GPT-5.6 Terra | 平衡型企业模型 | 2.5 美元 | 15 美元 | | GPT-5.6 Luna | 高效率、低成本模型 | 1 美元 | 6 美元 |

GPT 5.6 与 Claude、Gemini、Grok 等 API 价格比较

除了公布 GPT-5.6 系列定价之外,VentureBeat 也整理目前主流大型语言模型(LLM)的 API 价格。

从整体市场来看,GPT-5.6 Luna 定位在中低价带,每 100 万 Token 输入价格为 1 美元、输出价格为 6 美元,总成本约 7 美元,介于 GLM-5.2 与 Grok 4.3(Low Context)之间。

若需要更高的推理能力,GPT-5.6 Terra 的总成本约 17.5 美元,与 GPT-5.4 相同;旗舰模型 GPT-5.6 Sol 则维持与 GPT-5.5 相同的定价,每 100 万 Token 输入 5 美元、输出 30 美元,总成本约 35 美元,低于 Anthropic 最新 Claude Fable 5/Claude Mythos 5 的 60 美元。

主流 AI 模型 API 价格比较(每 100 万 Token),由外媒《VentureBeat》整理

| 模型 | Input | Output | 总成本 | | --- | --- | --- | --- | | MiMo-V2.5 Flash | 0.10 美元 | 0.30 美元 | 0.40 美元 | | DeepSeek V4 Flash | 0.14 美元 | 0.28 美元 | 0.42 美元 | | DeepSeek V4 Pro | 0.435 美元 | 0.87 美元 | 1.305 美元 | | MiniMax M3 | 0.30 美元 | 1.20 美元 | 1.50 美元 | | Gemini 3.1 Flash Lite | 0.25 美元 | 1.50 美元 | 1.75 美元 | | Qwen3.7 Plus | 0.40 美元 | 1.60 美元 | 2.00 美元 | | MiMo-V2.5 | 0.40 美元 | 2.00 美元 | 2.40 美元 | | Grok 4.3(Low Context) | 1.25 美元 | 2.50 美元 | 3.75 美元 | | MiMo-V2.5 Pro(≤256K) | 1.00 美元 | 3.00 美元 | 4.00 美元 | | Kimi-K2.6 | 0.95 美元 | 4.00 美元 | 4.95 美元 | | GLM-5.2 | 1.40 美元 | 4.40 美元 | 5.80 美元 | | GPT-5.6 Luna | 1.00 美元 | 6.00 美元 | 7.00 美元 | | Grok 4.3(High Context) | 2.50 美元 | 5.00 美元 | 7.50 美元 | | MiMo-V2.5 Pro(>256K) | 2.00 美元 | 6.00 美元 | 8.00 美元 | | Qwen3.7 Max | 2.50 美元 | 7.50 美元 | 10.00 美元 | | Gemini 3.5 Flash | 1.50 美元 | 9.00 美元 | 10.50 美元 | | Gemini 3.1 Pro Preview(≤200K) | 2.00 美元 | 12.00 美元 | 14.00 美元 | | GPT-5.6 Terra | 2.50 美元 | 15.00 美元 | 17.50 美元 | | GPT-5.4 | 2.50 美元 | 15.00 美元 | 17.50 美元 | | Gemini 3.1 Pro Preview(>200K) | 4.00 美元 | 18.00 美元 | 22.00 美元 | | Claude Opus 4.8 | 5.00 美元 | 25.00 美元 | 30.00 美元 | | GPT-5.5 | 5.00 美元 | 30.00 美元 | 35.00 美元 | | GPT-5.5 Instant | 5.00 美元 | 30.00 美元 | 35.00 美元 | | Sakana Fugu Ultra | 5.00 美元 | 30.00 美元 | 35.00 美元 | | GPT-5.6 Sol | 5.00 美元 | 30.00 美元 | 35.00 美元 | | Claude Fable 5/Claude Mythos 5 | 10.00 美元 | 50.00 美元 | 60.00 美元 |

OpenAI 此次改采 Sol、Terra、Luna 命名,更容易让企业依照能力、速度与成本挑选适合的模型,而非以模型大小作为区分依据。

GPT 5.6新技术:更深度推理与子代理协作

除了模型能力提升外,GPT-5.6 也导入新的推理模式。根据 OpenAI 公布内容,Sol 新增 Max Reasoning 模式,可让模型投入更多推理时间,提升复杂任务的完成品质。

同时,OpenAI 也推出 Ultra 模式,透过多个子代理(Subagent)协同合作处理大型任务,而非由单一 Agent 完成所有工作,借此提升大型专案与长流程工作的效率。

这项设计主要针对企业 Agent 工作流程打造,透过将复杂工作拆分给多个子代理共同处理,可改善长时间推理、程式开发及大型专案执行效率,也是 GPT-5.6 与 GPT-5.5 的重要差异之一。

Benchmark全面提升,TerminalBench创新高

根据 OpenAI 公布的测试结果,GPT-5.6 Sol 在 TerminalBench 2.1 指令列工作流程测试创下目前最佳成绩,超越 GPT-5.5,也高于 Claude Mythos 5 等竞争模型。

此外,GeneBench 生物研究测试中,GPT-5.6 Sol 在使用更少 Token 的情况下,也取得比 GPT-5.5 更好的成绩。

从多项测试可发现,Sol 在 Agent's Last Exam、TerminalBench 及 ExploitBench 等基准测试皆优于 GPT-5.5,而 Terra 在不少工作流程测试中也超越上一代旗舰模型,Luna 则在维持低成本下,仍提供接近 GPT-5.5 的能力表现。

Prompt Cache机制更新,Cerebras将提供最高 750 Token/秒

OpenAI 同步更新 Prompt Cache 机制,新增明确 Cache Breakpoint,并提供至少 30 分钟快取保存时间。官方表示,快取写入将依未快取输入价格的 1.25 倍计费,而快取读取则维持 90% 折扣,可让企业更容易控制 Agent 工作流程的 Token 成本。

另一方面,OpenAI 也宣布 GPT-5.6 Sol 将于今年 7 月登上 Cerebras 平台,最高可达每秒 750 Token 的推论速度,主要锁定需要低延迟、高效能的大型企业应用。

对于大量重复工作流程而言,新的快取机制搭配高速推论,可望降低整体运算成本。

企业应用更强,但安全防护同步提升

OpenAI 表示,GPT-5.6 系列采用目前最完整的多层安全防护架构,包括模型层级拒绝机制、即时生物与网络安全分类器、账号层级风险分析及持续红队测试等措施,希望兼顾资安防御需求,同时降低恶意用途。

官方表示,GPT-5.6 Sol 更擅长协助找出漏洞与修补弱点,但尚未达到可自主完成完整攻击流程的 Cyber Critical 等级。

OpenAI 为 GPT-5.6 投入约 70 万 A100 GPU 小时进行自动化红队测试,同时加入即时风险侦测、Activation Classifier 及推理期间安全审查等机制。不过,由于资安研究本身具有双重用途,OpenAI 也坦言,部分合法工作仍可能受到安全检查影响。

GPT 5.6分阶段发布反映AI治理新方向

此次 GPT-5.6 采取限量预览,也成为近期 AI 治理的重要案例。

根据 OpenAI 说明,公司在正式发布前,已先向美国政府说明模型能力及发布规划,并依政府要求先提供少数受信任合作伙伴测试,再逐步扩大开放。

OpenAI 表示,希望这种政府先行审查的做法只是过渡措施,未来仍期待让开发者、企业及一般使用者更广泛取得最新模型。

据《Decrypt》报道,此次限制发布也与美国政府近期建立新一代 AI 模型评估框架有关。在 Anthropic 的 Claude Mythos 5 与 Claude Fable 5 受到限制后,GPT-5.6 成为近期第二个受到美国政府发布流程影响的前沿 AI 模型。

依最近两大巨头的情况来看,未来大型 AI 模型上市时,政府安全审查、企业治理及模型能力评估,可能逐渐成为发布流程的一部分。

  • **相关报道:**Claude Fable 5被禁下架!白宫顾问揭露禁用内幕,杨立昆批自食恶果
SOL1.87%
LUNA-0.39%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论
  • 置顶