📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
#我的Gate交易时刻 AI vs 人类:谁才是世界杯终极预言家?
人机大战,谁是世界杯预言家?冲刺万亿的智谱,用“全真模考”给出答案
2026年的夏天还没到最热的时候,但AI已经在经历两场截然不同、却互为印证的终极大考。
一场在资本市场,用万亿估值投票未来;一场在绿茵场,用模拟赛果检验当下。
近期,关于“智谱冲击万亿估值”的讨论甚嚣尘上。作为国产大模型的头部玩家,它被视作中国AI版图的“关键坐标”。而在另一条线上,一场由联想集团联合咪咕视频发起的“2026世界杯AI模拟预测赛”,正在把这批最顶尖的大模型,拉进一场零门槛、全透明的实战考试。资本看的是远期想象力,赛场验证的是当下真实力。
01|万亿AI下场实测:世界杯是“全真模拟考”
这不是一场普通的营销活动,而是一次大模型能力的极限压力测试。参赛阵容堪称“AI国家队全员出战”:智谱AI、DeepSeek、百度文心、腾讯混元、Kimi、MiniMax、通义千问、商汤小浣熊、联想天禧、中移九天等十余款头部模型同台竞技。与资本市场晦涩的估值逻辑不同,世界杯预测是一个即时反馈系统:没有修饰、没有包装、没有预期管理。每一场模拟赛结束,AI的对错立刻见分晓,胜率、准确率、纠偏能力全部公开透明。截至“乌拉圭2:2战平佛得角”这场焦点模拟战落幕,本轮测试已完成39场赛事核验,全网最新榜单正式出炉:中移九天暂居榜首:39场命中23场,综合胜率59.0%
智谱AI稳居第一梯队:39场猜对22场胜负,胜率56.4%,并精准命中2场比分
第二梯队高度胶着:百度文心、DeepSeek、通义千问、腾讯混元、MiniMax、联想天禧、商汤小浣熊等,战绩均为22/39,胜率同为56.4%这组数据,直接打破了“头部AI差距悬殊”的行业迷思。
在充满不确定性的现实模拟场景中,国产第一梯队大模型能力高度接近——没有绝对碾压,只有毫厘之差。冲刺万亿估值的智谱,在这场全民“全真模考”中,稳稳站在了第一梯队。
02|资本给估值,赛场给真相:AI赢在规律,输在人性
为什么资本市场愿意给智谱们如此高的溢价?
核心逻辑其实和这场预测赛如出一辙:大模型的核心价值,就是理解复杂世界、处理不确定信息、做出高概率判断。而足球(哪怕是模拟赛),正是现实世界“不确定性”的极致缩影。
纵观这39场模拟对局,“爆冷”无处不在:西班牙0:0闷平、葡萄牙被逼平、土耳其爆冷输球……一次次“反常识”的结果,反复印证一个真理:纸面实力 ≠ 赛场结局
球员临场状态、突发伤病、红牌减员、战术突变、心态起伏、运气博弈……这些无法被完全量化的变量,是人类世界的温度,也是算法模型的盲区。但即便如此,56.4%的综合胜率,依然展现了顶级大模型的稳定性与推理效率。相比普通球迷依赖情怀、直觉、主观喜好的“情绪化预测”,AI依托海量数据与深度学习,在复杂场景中做到了稳定输出、风险可控。
更值得关注的是:所有头部AI胜率高度扎堆。这说明,在“预测复杂现实场景”这件事上,国产大模型已经集体跨过基础门槛,行业正式从“有无之争”进入“精耕细作”阶段。