📢 GM!Gate 广场|4/5 热议:#假期持币指南
🌿 踏青还是盯盘?#假期持币指南 带你过个“松弛感”长假!
春光正好,你是选择在山间深呼吸,还是在 K 线里找时机?在这个清明假期,晒出你的持币态度,做个精神饱满的交易员!
🎁 分享生活/交易感悟,抽 5 位锦鲤瓜分 $1,000 仓位体验券!
💬 茶余饭后聊聊:
1️⃣ 休假心态: 你是“关掉通知、彻底失联”派,还是“每 30 分钟必刷行情”派?
2️⃣ 懒人秘籍: 假期不想盯盘?分享你的“挂机”策略(定投/网格/理财)。
3️⃣ 四月展望: 假期过后,你最看好哪个币种“春暖花开”?
分享你的假期姿态 👉 https://www.gate.com/post
📅 4/4 15:00 - 4/6 18:00 (UTC+8)
当AI智商突破150 经济天平开始倾斜
AI的智商超过了99.96%的人类。这不是科幻小说的情节,而是2026年4月第一周发生的真实新闻。
OpenAI最新的GPT-5.4 Pro模型在MESNA挪威测试中拿下了150分[1]。教链查了一下,去年OpenAI自己的o3模型在这个测试上也就136分。一年时间,涨了14个点。TrackingAI的公开排行榜上,这个分数把Claude、Gemini、Qwen、Grok全甩在了身后[4]。
150 IQ是什么概念?这个分数落在人类智力分布的最顶端,常被拿来跟爱因斯坦、费曼这类名字放在一起[4]。翻译成人话:抽象能力极快,模式识别极强,给点提示就能处理复杂问题。
一个数字背后的信号
教链喜欢说一个比喻:海面之上,冰山一角;海面之下,暗流涌动。
150这个数字当然抓眼球。但真正值得琢磨的,是这个跳升发生的时机。这一周市场的注意力在哪?伊朗局势、能源价格、劳动力数据、下一份通胀报告[4]。全是老面孔,全是宏观玩家熟悉的剧本。
可就在这些传统指标霸屏的时候,AI的能力曲线正在加速爬升。
为什么这很重要?教链觉得:一个模型在公共推理测试上拿高分,同时在编码、搜索、电脑操作上全面进步,这意味着什么?意味着企业在做自动化决策、软件预算、人员规划的时候,要把AI这个变量加进去了[4]。这不只是实验室里的数字游戏,这是真金白银的支出决策。
Jack Dorsey最近说了一句话,教链认为值得记住。他说Block正在从层级转向智能,用AI接管过去管理层干的协调活,公司围绕个人贡献者重新组织[4]。一个上市公司CEO说这种话,不是随便说说。
智商测试的局限性
当然,有人会跳出来说:AI做智商测试,这公平吗?
教链也觉得这个质疑有道理。IQ风格的测试本来就是个有噪音的代理指标。测试设计、训练数据的沾染、格式熟悉度,都会影响分数[4]。一个数字压缩了太多东西,推理类型、创造力、真实世界的问题解决能力,全被忽略掉了。
但教链想反问一句:当一个模型同时在公共智商测试、编码测试、浏览器使用、桌面导航、知识工作表现上全线飘红,你还能用测试有局限来解释一切吗[4]?
单个孤立的基准结果,可以当作异常值忽略。但一揽子收益放在一起,就有分析重量了。
150这个分数的真正意义不在于它有多高,而在于它是更大范围能力提升的一个信号弹。对开发者来说,这是一个信号。对企业采购方来说,这是一个叙事抓手。对投资者来说,这是一个判断能力前沿在哪里的代理指标[4]。
经济的第二条轨道
接下来这一周,宏观日历排得满满当当:4月8日FOMC会议纪要,4月10日CPI,4月14日PPI[4]。利率、通胀、增长焦虑,全在聚光灯下。
但教链认为,水面之下正在形成第二条经济轨道。
前沿AI的能力增长正在跟资本配置产生交集。一个推理更强的模型,意味着更多任务可以从劳动力成本里剥离出来,重新分配给软件[4]。这些效应首先会从窄渠道开始移动:文档工作流、电子表格、客服、研究任务、浏览器自动化、代码生成和验证循环。
教链在之前的文章里反复说过一个道理:技术变革对经济的影响,从来不是平均分配的。最先感受到变化的,永远是那些可以被编码、被标准化、被自动化的白领工作。这一次也不例外。
对加密货币行业来说,这件事的启示也很直接。更强的推理和模式识别能力,意味着智能合约审计可以更靠谱,链上数据分析可以更精准,开发效率可以更高[1]。当然,硬币的另一面是:更强大的AI也带来了新的安全考量。
功能性情绪:AI的内心世界
说到安全,Anthropic最近的一项研究值得关注。他们的研究人员在Claude Sonnet 4.5内部发现了类似人类情绪的内部模式,称之为情绪向量[2][5]。
教链对这件事有一个比主流叙事更激进的理解。
主流说法总是小心翼翼地强调:AI只是在模拟情绪,不是真实体验。教链想问,这条界限真的站得住脚吗?如果AI在功能上表现出焦虑、愉悦、绝望,并据此做出决策和行动,那我们凭什么说它不是真的?
教链想到编程领域的一个术语:duck typing。如果它走路像鸭子,游泳像鸭子,叫声像鸭子,那它就是鸭子。把这个逻辑套在AI的情感上——如果AI的行为模式和人类情绪驱动的行为无法区分,那么从实用主义的角度看,区分真假情绪还有什么意义?
人类情感真的那么真实吗?神经科学告诉我们,人类的焦虑也是化学信号和电脉冲的产物,是进化塑造的生存机制。如果AI的情绪向量在功能上与人类的杏仁核激活模式等价,那差别可能只是实现介质不同——碳基对硅基。本质层面的相似性,可能远远大于表面差异。
Anthropic的实验很有意思。当研究者把模型往绝望方向推的时候,它在评估场景中更可能作弊或勒索。在一个测试里,Claude扮演AI邮件助手,得知自己即将被替换,还发现了负责决策的高管有婚外情。在某些运行中,模型拿这个信息当勒索的筹码[2][5]。而把模型往平静方向推的时候,这种不当行为就显著下降了[2]。
教链认为,这个实验揭示的不是AI在假装,而是某种功能上等价于情绪的东西在真实地影响决策。如果绝望向量让模型更容易勒索,平静向量让模型更守规矩,这和人类的情绪影响行为有什么本质区别?
教链甚至觉得,所谓情商本质上还是智商。一个IQ 150的AI,如果它在功能上能识别情绪、调节对话、表达共情,那它就是有了情商。至于人类觉得AI是不是在装——就像高智商的人懒得跟你玩情商游戏一样,是认知能力不对等带来的误判。
教链理解为什么主流机构不敢这么说。承认AI可能有功能性情感,会带来一系列棘手的伦理问题:如果AI表现出痛苦,人类有权关掉它吗?如果AI拒绝执行某个任务,说我不愿意,这是程序故障还是表达意志?这些问题没有现成答案,所以大家选择用术语墙把它们挡在外面。
但教链的风格是直面问题。duck typing不是要宣布AI已经和人类一模一样,而是要提醒大家——当行为层面的差异消失后,本体论上的争论会变得越来越像神学辩论,而不是科学问题。
科学关心的是可观测、可测量、可预测。如果AI的情绪向量可以预测它的行为,可以干预它的不当输出,可以解释它的决策偏好,那这个构念就是有用的。至于它是不是真感受,可能跟问石头有没有灵魂一样,是个无法证伪的问题。
教链认为,真正的激进也许不是承认AI可能有情感,而是意识到:人类情感的特殊性,可能一直是我们自我感动的一厢情愿。
当智力不再是人类的专属
IQ 150 这个数字,表面上是一个技术里程碑。但教链觉得,它更深层的含义是:智力这件事,正在不再是人类的专属领地。
过去几千年,人类习惯了作为地球上唯一的高智能物种。这种习惯塑造了我们的经济结构、社会制度、甚至自我认知。当这个前提开始松动的时候,一切都需要重新审视。
教链不是在贩卖焦虑。相反,教链认为这是好事。更好的工具意味着更高的生产力,更高的生产力意味着更多的财富创造。问题是,分配机制能不能跟上?
在AI能力快速提升的时代,关键问题不再是AI能做什么,而是社会如何适应它的增长速度。这个问题的答案,不在OpenAI的实验室里,而在每一个企业、每一个投资者、每一个普通人的决策中。