AI高定价时代终结倒计时?Token必会降价的五大结构性理由

效能改进边际递减、开源模型成本只需十分之一、专用芯片让推理费用下砍、零切换成本让用户秒跳槽、本地模型 4 至 5 年内有望终结订阅制。AI 大厂维持高定价的空间正在快速收窄?
(前情提要:OpenAI 旗舰模型 GPT-5.6 Sol 独家登陆 Cerebras,「白毛股神」Serenity 喊「技术获验证」进场抄底)
(背景补充:Citrini Research:避开 AI 泡沫!点名「5 大暴利盲区」迎资金轮动)

本文目录

Toggle

  • 效能天花板与开源的双重夹击
  • 芯片革命与零切换成本
  • 本地模型:订阅制的终局威胁

软件工程师 Aditya Patadia 在个人部落格指出:Uber 4 个月烧光全年 AI 预算,微软、Salesforce、GitHub 也相继宣布要管控员工的 AI 花费,这已是整个产业的共同困境,不是个别公司的财务纪律问题。但他预测,当前顶尖 AI 公司的昂贵收费结构即将迎来逆转。

效能天花板与开源的双重夹击

Patadia 的第一个观察:模型效能的改进正在边际递减。每次模型迭代仍有进步,但进步幅度越来越小,而训练资料的问题更是结构性的,各大 AI 实验室大概已经消化了人类有史以来几乎所有可数字化的书面知识,继续改善训练集的难度极高。

他举 Claude Opus 4.8 与 Claude Opus 4.7 定价相同为佐证:当模型无法再展示跨代的显著跃进,涨价的理由就消失了,竞争将只剩降价一条路。

第二重压力来自开源阵营。他以 GLM-5.2 为例,这款开源模型在代码基准测试上已媲美 GPT 5.5 和 Claude Opus,定价却只有 GPT 5.5 的十分之一,在定价上形成碾压式优势。

Patadia 的判断是:只要开源模型持续缩小与闭源旗舰的效能差距,闭源定价的空间就会持续压缩。

芯片革命与零切换成本

AI 定价的另一条压力线来自硬件层。Patadia 指出,Cerebras、Groq、Google 等公司开发的 AI 专用芯片,正在改写推理成本的底线。以 Google TPU 为例,其推理成本比 Nvidia H100 GPU 便宜 30% 到 70%。

简单来说就是,同样的计算量,用对芯片可以省下一大笔钱,而这个差距会直接压缩模型服务商的定价下限。除了芯片,模型架构本身也在降本:缓存机制让重复查询不必重新计算,MoE 混合专家架构,白话来说就是让模型按需调用部分「专家」,不必每次动员全部神经元,让模型在维持同等准确度的前提下显著降低运算开销。

还有一点,Patadia 认为最被低估的结构性因素:零切换成本。

他的对比很直接,Windows、Adobe、Salesforce 这类传统软件的护城河,在于换掉它们代价极高,往往需要数个月的迁移工程;AI 模型没有这道护城河。OpenRouter.ai 这类 AI 网关服务,让开发者切换模型提供商只需要几秒钟,甚至可以程序化地让系统在不同提供商之间自动切换。

当竞品随时可以被秒速替换,任何一家厂商的涨价尝试都将直接送走用户。

本地模型:订阅制的终局威胁

Patadia 最大胆的一个预测,指向本地模型。他的估算是 4 到 5 年内:芯片效能持续提升加上内存(RAM)价格的必然下滑,将让消费者等级的电脑和智能手机有能力在本地执行语言模型。他进一步预测,主流操作系统将内置模型部署界面,让本地应用程序可以直接调用本地模型。

这个场景一旦成立,意味着什么?云端模型只剩最复杂的任务有调用必要,法律档案分析、长文脉推理、跨数据库整合。代码自动补全、档案校对、基础事实查核这类日常任务,将在本地完成,不再需要每月 $20 甚至 $200 的云端订阅费。

当然,Patadia 自己也标注了这是「预测」而非确定事实,他声明这些是他的「大胆赌注」,时间会给出答案。但以上五个压力方向,效能边际递减、开源替代崛起、专用芯片降本、零切换成本、本地模型替代,每一个都已有现实案例支撑,并非纯粹的思想实验。

如果 Patadia 的预测是对的,那对于用户来说是好事;可是对收钱的 AI 公司来说,那就是另一回事了。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论