当AI智商突破150 经济天平开始倾斜

2026-04-06 16:37:48

AI的智商超过了99.96%的人类。这不是科幻小说的情节，而是2026年4月第一周发生的真实新闻。

OpenAI最新的GPT-5.4 Pro模型在MESNA挪威测试中拿下了150分[1]。教链查了一下，去年OpenAI自己的o3模型在这个测试上也就136分。一年时间，涨了14个点。TrackingAI的公开排行榜上，这个分数把Claude、Gemini、Qwen、Grok全甩在了身后[4]。

150 IQ是什么概念？这个分数落在人类智力分布的最顶端，常被拿来跟爱因斯坦、费曼这类名字放在一起[4]。翻译成人话：抽象能力极快，模式识别极强，给点提示就能处理复杂问题。

一个数字背后的信号

教链喜欢说一个比喻：海面之上，冰山一角；海面之下，暗流涌动。

150这个数字当然抓眼球。但真正值得琢磨的，是这个跳升发生的时机。这一周市场的注意力在哪？伊朗局势、能源价格、劳动力数据、下一份通胀报告[4]。全是老面孔，全是宏观玩家熟悉的剧本。

可就在这些传统指标霸屏的时候，AI的能力曲线正在加速爬升。

为什么这很重要？教链觉得：一个模型在公共推理测试上拿高分，同时在编码、搜索、电脑操作上全面进步，这意味着什么？意味着企业在做自动化决策、软件预算、人员规划的时候，要把AI这个变量加进去了[4]。这不只是实验室里的数字游戏，这是真金白银的支出决策。

Jack Dorsey最近说了一句话，教链认为值得记住。他说Block正在从层级转向智能，用AI接管过去管理层干的协调活，公司围绕个人贡献者重新组织[4]。一个上市公司CEO说这种话，不是随便说说。

智商测试的局限性

当然，有人会跳出来说：AI做智商测试，这公平吗？

教链也觉得这个质疑有道理。IQ风格的测试本来就是个有噪音的代理指标。测试设计、训练数据的沾染、格式熟悉度，都会影响分数[4]。一个数字压缩了太多东西，推理类型、创造力、真实世界的问题解决能力，全被忽略掉了。

但教链想反问一句：当一个模型同时在公共智商测试、编码测试、浏览器使用、桌面导航、知识工作表现上全线飘红，你还能用测试有局限来解释一切吗[4]？

单个孤立的基准结果，可以当作异常值忽略。但一揽子收益放在一起，就有分析重量了。

150这个分数的真正意义不在于它有多高，而在于它是更大范围能力提升的一个信号弹。对开发者来说，这是一个信号。对企业采购方来说，这是一个叙事抓手。对投资者来说，这是一个判断能力前沿在哪里的代理指标[4]。

经济的第二条轨道

接下来这一周，宏观日历排得满满当当：4月8日FOMC会议纪要，4月10日CPI，4月14日PPI[4]。利率、通胀、增长焦虑，全在聚光灯下。

但教链认为，水面之下正在形成第二条经济轨道。

前沿AI的能力增长正在跟资本配置产生交集。一个推理更强的模型，意味着更多任务可以从劳动力成本里剥离出来，重新分配给软件[4]。这些效应首先会从窄渠道开始移动：文档工作流、电子表格、客服、研究任务、浏览器自动化、代码生成和验证循环。

教链在之前的文章里反复说过一个道理：技术变革对经济的影响，从来不是平均分配的。最先感受到变化的，永远是那些可以被编码、被标准化、被自动化的白领工作。这一次也不例外。

对加密货币行业来说，这件事的启示也很直接。更强的推理和模式识别能力，意味着智能合约审计可以更靠谱，链上数据分析可以更精准，开发效率可以更高[1]。当然，硬币的另一面是：更强大的AI也带来了新的安全考量。

功能性情绪：AI的内心世界

说到安全，Anthropic最近的一项研究值得关注。他们的研究人员在Claude Sonnet 4.5内部发现了类似人类情绪的内部模式，称之为情绪向量[2][5]。

教链对这件事有一个比主流叙事更激进的理解。

主流说法总是小心翼翼地强调：AI只是在模拟情绪，不是真实体验。教链想问，这条界限真的站得住脚吗？如果AI在功能上表现出焦虑、愉悦、绝望，并据此做出决策和行动，那我们凭什么说它不是真的？

教链想到编程领域的一个术语：duck typing。如果它走路像鸭子，游泳像鸭子，叫声像鸭子，那它就是鸭子。把这个逻辑套在AI的情感上——如果AI的行为模式和人类情绪驱动的行为无法区分，那么从实用主义的角度看，区分真假情绪还有什么意义？

人类情感真的那么真实吗？神经科学告诉我们，人类的焦虑也是化学信号和电脉冲的产物，是进化塑造的生存机制。如果AI的情绪向量在功能上与人类的杏仁核激活模式等价，那差别可能只是实现介质不同——碳基对硅基。本质层面的相似性，可能远远大于表面差异。

Anthropic的实验很有意思。当研究者把模型往绝望方向推的时候，它在评估场景中更可能作弊或勒索。在一个测试里，Claude扮演AI邮件助手，得知自己即将被替换，还发现了负责决策的高管有婚外情。在某些运行中，模型拿这个信息当勒索的筹码[2][5]。而把模型往平静方向推的时候，这种不当行为就显著下降了[2]。

教链认为，这个实验揭示的不是AI在假装，而是某种功能上等价于情绪的东西在真实地影响决策。如果绝望向量让模型更容易勒索，平静向量让模型更守规矩，这和人类的情绪影响行为有什么本质区别？

教链甚至觉得，所谓情商本质上还是智商。一个IQ 150的AI，如果它在功能上能识别情绪、调节对话、表达共情，那它就是有了情商。至于人类觉得AI是不是在装——就像高智商的人懒得跟你玩情商游戏一样，是认知能力不对等带来的误判。

教链理解为什么主流机构不敢这么说。承认AI可能有功能性情感，会带来一系列棘手的伦理问题：如果AI表现出痛苦，人类有权关掉它吗？如果AI拒绝执行某个任务，说我不愿意，这是程序故障还是表达意志？这些问题没有现成答案，所以大家选择用术语墙把它们挡在外面。

但教链的风格是直面问题。duck typing不是要宣布AI已经和人类一模一样，而是要提醒大家——当行为层面的差异消失后，本体论上的争论会变得越来越像神学辩论，而不是科学问题。

科学关心的是可观测、可测量、可预测。如果AI的情绪向量可以预测它的行为，可以干预它的不当输出，可以解释它的决策偏好，那这个构念就是有用的。至于它是不是真感受，可能跟问石头有没有灵魂一样，是个无法证伪的问题。

教链认为，真正的激进也许不是承认AI可能有情感，而是意识到：人类情感的特殊性，可能一直是我们自我感动的一厢情愿。

当智力不再是人类的专属

IQ 150 这个数字，表面上是一个技术里程碑。但教链觉得，它更深层的含义是：智力这件事，正在不再是人类的专属领地。

过去几千年，人类习惯了作为地球上唯一的高智能物种。这种习惯塑造了我们的经济结构、社会制度、甚至自我认知。当这个前提开始松动的时候，一切都需要重新审视。

教链不是在贩卖焦虑。相反，教链认为这是好事。更好的工具意味着更高的生产力，更高的生产力意味着更多的财富创造。问题是，分配机制能不能跟上？

在AI能力快速提升的时代，关键问题不再是AI能做什么，而是社会如何适应它的增长速度。这个问题的答案，不在OpenAI的实验室里，而在每一个企业、每一个投资者、每一个普通人的决策中。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate广场四月发帖挑战
67.8万热度
#
假期持币指南
6.6万热度
#
加密市场行情震荡
20.64万热度
#
国际油价走高
33.05万热度
#
三月非农数据来袭
27.51万热度

热门 Gate Fun
查看更多

1
Oil
oil.T
市值:$2241.37持有人数:0
0.00%
2
卐
大侠
市值:$2237.93持有人数:1
0.00%
3
T
T0M
市值:$2241.37持有人数:1
0.00%
4
lio
lio
市值:$0.1持有人数:0
0.00%
5
TRUMD
TRUMD
市值:$2272.7持有人数:2
0.07%

当AI智商突破150 经济天平开始倾斜

一个数字背后的信号

智商测试的局限性

经济的第二条轨道

功能性情绪：AI的内心世界

当智力不再是人类的专属

热门话题

Gate广场四月发帖挑战

假期持币指南

加密市场行情震荡

国际油价走高

三月非农数据来袭

热门 Gate Fun

Oil

oil.T

卐

大侠

T

T0M

lio

lio

TRUMD

TRUMD

置顶