預測世界盃淘汰賽，不同AI水平差這麼多？

Question

> 原文標題：《預測世界盃淘汰賽，不同AI水平差這麼多？》 > 原文作者：Asher，Odaily 星球日報 世界盃每場賽前，我都會讓 AI 預測下，幾乎每個模型都說得頭頭是道、細節滿滿。 有的講球隊身價，有的拆小組賽數據，有的分析傷病和戰術，還有的直接給出比分、加時、點球劇本。乍一看，ChatGPT、Grok、千問、DeepSeek、Gemini、Claude 都好懂球噢。 但作為預測市場用戶，我真正關心的不是哪個模型說得更完整，而是哪一個更值得參考。 隨著世界盃進入淘汰賽階段，**Odaily 星球日報從首場比賽開始，在賽前用盡量相同的問題詢問不同 AI 模型，並在賽後對照真實結果回看——哪些模型只是分析得像那麼回事，哪些模型真的提前捕捉到了比賽走向。** 目前，已經結束的世界盃淘汰賽，加拿大 1:0 絕殺南非，巴西 2:1 險勝日本，德國被巴拉圭拖進點球大戰後淘汰，荷蘭也倒在了摩洛哥的點球下。到了比利時對塞內加爾，比賽更是踢成了 2:2 後加時逆轉，直接把淘汰賽的不確定性拉滿。 ### DeepSeek 和 Gemini，靠預判摩洛哥一戰封神 **目前最有記憶點的，還是 DeepSeek 和 Gemini 對荷蘭 vs 摩洛哥這場的預測。**這場賽前其實很容易站錯隊——荷蘭紙面實力更強，陣容也更完整，很多模型都知道摩洛哥不好踢，但最後還是更相信荷蘭能過關。 DeepSeek 和 Gemini 厲害的地方在於，它們沒有停在「這場會很膠著」這一步，而是把後面的劇本也寫出來了。**Gemini 賽前直接給出常規時間 1:1，點球大戰摩洛哥勝。**結果比賽真的踢成 1:1，最後摩洛哥點球 3:2 淘汰荷蘭。不是只猜對方向，而是連比賽會怎麼被拖進點球、最後誰笑到最後，都基本對上了。 ![](https://img-cdn.gateio.im/social/moments-3729da956e-e6876ea67a-8b7abd-7649e1)> Gemini 預測荷蘭對陣摩洛哥的比賽 DeepSeek 也很接近。**它判斷這場常規時間大概率會是 1:1 或 0:0，比賽可能一路拖到加時甚至點球，並傾向摩洛哥靠防守和反擊爆冷晉級。** ![](https://img-cdn.gateio.im/social/moments-d5c522239b-2f12027b7a-8b7abd-7649e1)> Deepseek 預測荷蘭對陣摩洛哥的比賽 這一場之後，DeepSeek 和 Gemini 的存在感直接拉滿。尤其是 Gemini，這次不像是在做賽前預測，更像是提前看過了比賽劇本。 ### Grok 和千問連續命中具體比分，穩定性比想像中更強 除了 DeepSeek 和 Gemini 在摩洛哥這場打出高光，Grok 和千問也不是沒有存在感。**它們最亮眼的地方，是在一些勝負方向相對清晰的比賽裡，不只判斷對了晉級球隊，還把具體比分也預測得比較貼近最終結果。** 南非對加拿大就是一個例子。賽前多數 AI 模型都看好加拿大，但分歧在於加拿大會不會輕鬆贏。Grok 給賽前給出加拿大 1:0 的預測，千問也給出過一球小勝。最後加拿大確實只靠 1 個進球過關，沒有踢成想像中的大勝局。 ![](https://img-cdn.gateio.im/social/moments-a73ffd4b4a-3882aa4030-8b7abd-7649e1)> 千問預測南非對陣加拿大的比賽 巴西對日本也是類似。大部分 AI 模型都覺得巴西更強，但日本會不會把比賽咬住，才是這場的關鍵。Grok 和千問都預測比分会是 2:1，最後比賽也真的踢成巴西 2:1 險勝。它們看對的不是「巴西會贏」這麼簡單，而是日本能給巴西製造足夠麻煩。 科特迪瓦對挪威這場，兩者同樣踩得比較準。挪威有哈蘭德，晉級方向不難理解，但科特迪瓦的身體對抗和邊路衝擊也不會讓比賽變成一邊倒。Grok 和千問都預測挪威 2:1 獲勝，最後比分也正好落在這個”劇本“裡。 ![](https://img-cdn.gateio.im/social/moments-238eccee24-8529bcb1e0-8b7abd-7649e1)> Gork 預測科特迪瓦對陣挪威的比賽 Grok 和千問的優勢，是把熱門局看得更細。**它們沒有提前寫出摩洛哥淘汰荷蘭這種大劇本，但在加拿大、巴西、挪威、法國這些比賽裡，勝負方向和比分落點都給得比較貼。**換句話說，它們不一定最會抓冷門，但很擅長判斷熱門隊到底是輾壓過關，還是艱難小勝。 ### ChatGPT 沒有太多神比分，但比賽過程分析比較準 ChatGPT 沒有像 Gemini 那樣提前預測出摩洛哥點球淘汰荷蘭，也沒有像 Grok、千問那樣連續踩中幾個具體比分。但它的優勢——很多比賽賽前看起來是強隊佔優，ChatGPT 會更明顯地提醒一句，這場可能沒有那麼輕鬆。 巴西對日本就是例子。ChatGPT 預測巴西晉級，但沒有把比賽寫成巴西輕鬆輾壓，而是提到日本的壓迫、跑動和紀律性會讓巴西踢得不舒服，甚至有機會先進球或追平。科特迪瓦對挪威也是類似，ChatGPT 預測挪威晉級，但提前說這不是一場輕鬆局，科特迪瓦的身體對抗、邊路衝擊和轉換能力都會製造麻煩。 ![](https://img-cdn.gateio.im/social/moments-07dbaf57f9-9cd75b16cf-8b7abd-7649e1)> ChatGPT 預測英格蘭對陣剛果民主共和國的比賽 ChatGPT 的長處，**不在於每次都把比分預測得很準，而是經常能提前說出比賽的阻力在哪裡**。它很適合拿來理解比賽，但適合只看一個最終比分的預測。它能把過程說得比較準，可真正要寫出大冷門時，還是少了一點決斷。 ### 德國出局，成了 AI 模型的集體翻車現場 如果說前面幾場還能看出不同模型各自的亮點，那麼德國對巴拉圭這場，就是一次集體翻車。 **賽前，所有 AI 模型都站在德國這邊。**ChatGPT、Grok、千問、Gemini、Claude 全部站在德國一邊，比分預測大多集中在 2:0、3:0 或 3:1。理由也很一致：都認為德國紙面實力更強，陣容深度更好，進攻火力更足。 但結果就是這場出了問題。AI 模型們低估了巴拉圭把比賽拖進泥潭的能力，德國沒能在常規時間解決戰鬥，也沒能在加時賽打破僵局，最後被巴拉圭拖進點球大戰並淘汰出局。 ### 目前誰最準？ 從目前已經結束的淘汰賽來看，不同模型的特點開始顯現。 **DeepSeek 和 Gemini 最有高光。**它們不只是能預測巴西、法國這類熱門隊晉級，在更難判斷的冷門場次裡，也給出了很有含金量的答案。荷蘭對摩洛哥這場，它們最關鍵的優勢，是敢於提前寫出摩洛哥爆冷和點球大戰劇本。尤其是 Gemini，直接預測摩洛哥點球晉級，這一場確實很亮眼。 **Grok 和千問更像「比分型選手」。**它們命中了不少具體比分，尤其在加拿大、巴西、挪威、法國這些比賽裡表現不錯。但問題是遇到德國、荷蘭這種傳統強隊時，最後還是偏向熱門。 **ChatGPT 和 Claude 則更像「分析型選手」。**理由寫得完整，方向大多數不離譜，也能提醒一些加時風險。但問題是，它們經常能看出比賽不好踢，卻不太敢把結論寫到冷門那邊。荷蘭對摩洛哥就是這樣，明明已經看到加時和點球風險，最後還是更相信荷蘭。 所以，與其急著問哪個模型最懂球，不如看它們分別適合什麼場景。 > 原文連結 點擊了解律动BlockBeats 在招崗位 **歡迎加入律动 BlockBeats 官方社群：**Telegram 訂閱群：https://t.me/theblockbeatsTelegram 交流群：https://t.me/BlockBeats_AppTwitter 官方帳號：https://twitter.com/BlockBeatsAsia

預測世界盃淘汰賽，不同AI水平差這麼多？

DeepSeek 和 Gemini，靠預判摩洛哥一戰封神

Grok 和千問連續命中具體比分，穩定性比想像中更強

ChatGPT 沒有太多神比分，但比賽過程分析比較準

德國出局，成了 AI 模型的集體翻車現場

目前誰最準？

熱門話題

Gate股票轉倉功能上線

Circle股價重挫17%

預測世界盃葡萄牙VS克羅地亞

沃什宣告終結前瞻指引

非農數據倒計時

已置頂