AI高定价时代终结倒计时？Token必会降价的五大结构性理由

Question

效能改进边际递减、开源模型成本只需十分之一、专用芯片让推理费用下砍、零切换成本让用户秒跳槽、本地模型 4 至 5 年内有望终结订阅制。AI 大厂维持高定价的空间正在快速收窄？
（前情提要：OpenAI 旗舰模型 GPT-5.6 Sol 独家登陆 Cerebras，「白毛股神」Serenity 喊「技术获验证」进场抄底）
（背景补充：Citrini Research：避开 AI 泡沫！点名「5 大暴利盲区」迎资金轮动）

本文目录

Toggle

效能天花板与开源的双重夹击
芯片革命与零切换成本
本地模型：订阅制的终局威胁

软件工程师 Aditya Patadia 在个人部落格指出：Uber 4 个月烧光全年 AI 预算，微软、Salesforce、GitHub 也相继宣布要管控员工的 AI 花费，这已是整个产业的共同困境，不是个别公司的财务纪律问题。但他预测，当前顶尖 AI 公司的昂贵收费结构即将迎来逆转。

效能天花板与开源的双重夹击

Patadia 的第一个观察：模型效能的改进正在边际递减。每次模型迭代仍有进步，但进步幅度越来越小，而训练资料的问题更是结构性的，各大 AI 实验室大概已经消化了人类有史以来几乎所有可数字化的书面知识，继续改善训练集的难度极高。

他举 Claude Opus 4.8 与 Claude Opus 4.7 定价相同为佐证：当模型无法再展示跨代的显著跃进，涨价的理由就消失了，竞争将只剩降价一条路。

第二重压力来自开源阵营。他以 GLM-5.2 为例，这款开源模型在代码基准测试上已媲美 GPT 5.5 和 Claude Opus，定价却只有 GPT 5.5 的十分之一，在定价上形成碾压式优势。

Patadia 的判断是：只要开源模型持续缩小与闭源旗舰的效能差距，闭源定价的空间就会持续压缩。

芯片革命与零切换成本

AI 定价的另一条压力线来自硬件层。Patadia 指出，Cerebras、Groq、Google 等公司开发的 AI 专用芯片，正在改写推理成本的底线。以 Google TPU 为例，其推理成本比 Nvidia H100 GPU 便宜 30% 到 70%。

简单来说就是，同样的计算量，用对芯片可以省下一大笔钱，而这个差距会直接压缩模型服务商的定价下限。除了芯片，模型架构本身也在降本：缓存机制让重复查询不必重新计算，MoE 混合专家架构，白话来说就是让模型按需调用部分「专家」，不必每次动员全部神经元，让模型在维持同等准确度的前提下显著降低运算开销。

还有一点，Patadia 认为最被低估的结构性因素：零切换成本。

他的对比很直接，Windows、Adobe、Salesforce 这类传统软件的护城河，在于换掉它们代价极高，往往需要数个月的迁移工程；AI 模型没有这道护城河。OpenRouter.ai 这类 AI 网关服务，让开发者切换模型提供商只需要几秒钟，甚至可以程序化地让系统在不同提供商之间自动切换。

当竞品随时可以被秒速替换，任何一家厂商的涨价尝试都将直接送走用户。

本地模型：订阅制的终局威胁

Patadia 最大胆的一个预测，指向本地模型。他的估算是 4 到 5 年内：芯片效能持续提升加上内存（RAM）价格的必然下滑，将让消费者等级的电脑和智能手机有能力在本地执行语言模型。他进一步预测，主流操作系统将内置模型部署界面，让本地应用程序可以直接调用本地模型。

这个场景一旦成立，意味着什么？云端模型只剩最复杂的任务有调用必要，法律档案分析、长文脉推理、跨数据库整合。代码自动补全、档案校对、基础事实查核这类日常任务，将在本地完成，不再需要每月 $20 甚至 $200 的云端订阅费。

当然，Patadia 自己也标注了这是「预测」而非确定事实，他声明这些是他的「大胆赌注」，时间会给出答案。但以上五个压力方向，效能边际递减、开源替代崛起、专用芯片降本、零切换成本、本地模型替代，每一个都已有现实案例支撑，并非纯粹的思想实验。

如果 Patadia 的预测是对的，那对于用户来说是好事；可是对收钱的 AI 公司来说，那就是另一回事了。

查看原文

AI高定价时代终结倒计时？Token必会降价的五大结构性理由

效能天花板与开源的双重夹击

芯片革命与零切换成本

本地模型：订阅制的终局威胁

热门话题

0成本拿2股SK海力士

美光市值超越Meta跻身全美前十

南非VS加拿大

美国5月PCE通胀升至4.1%创三年新高

USD1链上质押享年化9.48%

置顶