#广场预测世界杯赢40000U


AI預測「世界盃32強」準確率超越人類

2026年美加墨世界盃小組賽硝煙散盡,32強完整名單正式揭曉。在綠茵場上傳統強隊與黑馬球隊激烈角逐的同時,綠茵場之外,一場由人工智慧主導的「預測人機大戰」也迎來了階段性「結算」。

在聯想集團聯合咪咕視頻發起的「世界盃預測人機大戰」中,12家國內主流AI大模型和人類專家分別對104場賽事的結果進行了預測。最終數據顯示,AI陣營的整體預測準確率超越人類專家,且部分AI模型更是押中佛得角等並無世界盃歷史數據的冷門球隊,得出一些「反共識」的結果。

圖片來源:聯想官方供圖

從5月28日到世界盃開賽前,聯想天禧AI作為「總召集人」,向12家國內主流AI大模型和人類專家發送了一份《2026世界盃32強競猜統一考試》答題卡,要求在賽前提交自己的「答卷」。

北京時間6月28日,隨著J組收官戰阿爾及利亞隊與奧地利隊以3:3握手言和,各家AI預測的排名也隨之揭曉。其中,騰訊混元以命中29支晉級球隊的成績位列榜首,MiniMax與訊飛星火則以命中28支的成績緊隨其後。AI陣營的整體勝率達到61.9%,領先人類專家7.3%。

更具看點的是,在賽前預測時,12家AI裡就有四家大膽看好「新軍」佛得角。這一「反共識」的預測,被佛得角的戰績一一印證——該隊連續逼平西班牙、烏拉圭等傳統強隊,以不敗戰績出線。

商湯科技技術總監馬林向時代財經記者解釋稱,之所以AI大模型能押中佛得角這匹「最大黑馬」,原因在於模型能夠穿透紙面實力的表象,挖掘深層數據。佛得角雖為世界盃「新軍」,但其球員多在歐洲聯賽體系下成長,且近年來預選賽表現強勢。AI模型通過捕捉其足球防守紀律、反擊效率以及球員結構等深層數據變量,得出了比人類經驗更為理性的結論。

不過,AI在展現「反共識」能力的同時,也暴露出在極端不確定性下的局限。以佛得角對陣沙地阿拉伯為例,這場比賽12家AI判斷結果分化為三種:DeepSeek、Kimi、階躍、訊飛星火預測沙地阿拉伯勝;通義千問、中移九天、天禧AI、騰訊混元、商湯小浣熊預判雙方平局;百度文心、智譜、MiniMax看好佛得角取勝。儘管最終結果是平局,但沒有任何一家模型精準命中0:0的最終比分。

這一現象揭示了當前AI預測普遍存在「進攻火力高估」盲區。即便有5家模型預判了平局,它們給出的比分也均包含至少1粒進球。據聯想官方數據,在小組賽出現的9場平局中,AI的預測命中率不足3%。由此看來,AI大模型更擅長處理結構化數據與確定性趨勢,但對於足球這種集臨場心理、突發傷病及偶然性多重因素的團體運動,還是有AI大模型無法估測的部分。

這屆世界盃黑馬頻出,讓AI的預測變得五花八門。這其實暴露出大模型「底層邏輯趨同」的短板。因為大模型本質上是靠歷史數據做推演的「概率壓縮器」。在強弱分明的常規比賽裡,大家吃著同樣的數據,自然得出同樣的結論;但一旦遇到沒見過的球隊,或是比賽中出現了創新戰術或者極端打法,AI就會因為缺乏歷史參照而「集體失靈」。因為它們並沒有真正理解比賽,只是在面對未知時,各自憑概率猜測。

事實上,對世界盃結果預測的「人機大戰」並非聯想一家的獨角戲,多家頭部大模型廠商也早已下場參與:千問上線了專屬的足球預測AI助手,不僅覆蓋了全部104場比賽供用戶與AI同台競猜,還同步發起了「球場計劃」——當用戶的競猜積分達到一定數額後,千問將為鄉村學校捐建足球場。

月之暗面(Kimi)也搭建了300個專屬Agent,分別負責戰術分析、球員狀態追蹤、賽程計算以及賠率監測等細分方向,最終生成了一份長達224頁的深度預測報告,展現其多智能體協同處理複雜任務的能力。此外,Anthropic的Claude Fable 5模型也基於賽事結構(48隊參賽、冠軍需踢8場)、北美夏季高溫以及球隊陣容年齡曲線等宏觀變量給出預測。

這些多元化的參與方式,不僅讓AI預測從單純的「勝負競猜」演變為涵蓋數據分析、多Agent協同、公益互動及宏觀推演的綜合技術展示,也讓這場圍繞世界盃的「人機大戰」成為各大廠商檢驗大模型落地能力的絕佳試驗場。但從更高維度看,在商業決策、宏觀經濟研判乃至社會治理等複雜系統中,AI同樣面臨著「數據完備」與「現實混沌」的博弈。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 4
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
山顶楚老魔
· 4小時前
堅定持有💎
查看原文回復0
山顶楚老魔
· 4小時前
衝就完了 👊
查看原文回復0
Yunna
· 5小時前
衝啊 🔥
查看原文回復0
HighAmbition
· 5小時前
多謝更新
查看原文回復0