Prever as eliminatórias da Copa do Mundo, os diferentes níveis de IA diferem tanto assim?

Question

> Título original: "Previsão dos jogos eliminatórios da Copa do Mundo: será que diferentes IAs têm tanta diferença assim?"> Autor original: Asher, Odaily Planet DailyAntes de cada partida da Copa do Mundo, peço uma previsão à IA. Quase todos os modelos falam com muita convicção e cheios de detalhes.Alguns falam sobre o valor do elenco, outros analisam dados da fase de grupos, alguns discutem lesões e táticas, e outros ainda dão diretamente o placar, prorrogação e pênaltis. À primeira vista, ChatGPT, Grok, Qwen, DeepSeek, Gemini e Claude parecem entender muito de futebol.Mas, como usuário do mercado de previsões, o que realmente me importa não é qual modelo fala de forma mais completa, mas sim qual é mais confiável.Com a Copa do Mundo entrando na fase eliminatória, o **Odaily Planet Daily começou desde o primeiro jogo, fazendo a mesma pergunta, o mais idêntica possível, a diferentes modelos de IA antes das partidas, e depois, após os jogos, comparou com os resultados reais — quais modelos apenas pareciam fazer análises convincentes e quais realmente captaram a direção do jogo antecipadamente.**Atualmente, nos jogos eliminatórios já encerrados da Copa, o Canadá venceu a África do Sul por 1 a 0, o Brasil venceu o Japão por 2 a 1, a Alemanha foi eliminada pelo Paraguai após levar o jogo para os pênaltis, e a Holanda também caiu diante dos pênaltis do Marrocos. No jogo entre Bélgica e Senegal, a partida terminou em 2 a 2 e teve uma virada na prorrogação, elevando ao máximo a imprevisibilidade da fase eliminatória.### DeepSeek e Gemini, que se destacaram ao prever a partida do Marrocos**Atualmente, o mais memorável é a previsão de DeepSeek e Gemini para o jogo Holanda x Marrocos.** Antes desta partida, era fácil escolher o lado errado — a Holanda tinha um elenco teoricamente mais forte e mais completo. Muitos modelos sabiam que o Marrocos não seria fácil, mas no final, acreditavam mais que a Holanda passaria.O ponto forte do DeepSeek e do Gemini é que eles não pararam no "este jogo será muito disputado", mas sim escreveram o roteiro completo. **O Gemini previu diretamente antes do jogo um empate por 1 a 1 no tempo regulamentar e vitória do Marrocos nos pênaltis.** O resultado? O jogo realmente terminou 1 a 1 e, nos pênaltis, o Marrocos venceu a Holanda por 3 a 2. Não foi apenas acertar o lado, mas acertar como o jogo seria levado aos pênaltis e quem sairia vitorioso.![](https://img-cdn.gateio.im/social/moments-3729da956e-e6876ea67a-8b7abd-7649e1)> Previsão do Gemini para o jogo Holanda x MarrocosO DeepSeek também chegou perto. **Ele avaliou que o tempo regulamentar provavelmente terminaria em 1 a 1 ou 0 a 0, e que o jogo poderia ser levado para a prorrogação e até para os pênaltis, inclinando-se para uma surpresa do Marrocos, com defesa e contra-ataque.**![](https://img-cdn.gateio.im/social/moments-d5c522239b-2f12027b7a-8b7abd-7649e1)> Previsão do DeepSeek para o jogo Holanda x MarrocosDepois dessa partida, a presença do DeepSeek e do Gemini foi imediatamente destacada. Especialmente o Gemini, que não parecia estar apenas fazendo uma previsão antes do jogo, mas sim que já tinha visto o roteiro da partida.### Grok e Qwen acertam placares específicos consecutivamente, estabilidade maior do que se imaginavaAlém do DeepSeek e do Gemini terem se destacado no jogo do Marrocos, Grok e Qwen também não ficaram para trás. **O ponto mais brilhante deles é que, em algumas partidas onde a direção do resultado era relativamente clara, eles não apenas acertaram o time classificado, mas também previram o placar específico de forma muito próxima do resultado final.**A partida entre África do Sul e Canadá é um exemplo. Antes do jogo, a maioria dos modelos de IA favorecia o Canadá, mas a divergência estava em saber se o Canadá venceria com facilidade. O Grok previu uma vitória do Canadá por 1 a 0, e o Qwen também deu uma vitória por um gol de diferença. No final, o Canadá realmente passou com apenas um gol, sem a grande goleada que se imaginava.![](https://img-cdn.gateio.im/social/moments-a73ffd4b4a-3882aa4030-8b7abd-7649e1)> Previsão do Qwen para o jogo África do Sul x CanadáO jogo entre Brasil e Japão foi semelhante. A maioria dos modelos de IA achava que o Brasil era mais forte, mas se o Japão conseguiria segurar o jogo era o ponto crucial. Grok e Qwen previram um placar de 2 a 1, e o jogo realmente terminou com o Brasil vencendo por 2 a 1. O que eles acertaram não foi apenas "o Brasil vai vencer", mas sim que o Japão conseguiria causar problemas suficientes ao Brasil.No jogo entre Costa do Marfim e Noruega, ambos também acertaram bem. A Noruega tem Haaland, e a direção da classificação não era difícil de entender, mas a força física e o ataque pelas laterais da Costa do Marfim não deixariam o jogo ser uma via de mão única. Grok e Qwen previram uma vitória da Noruega por 2 a 1, e o placar final caiu exatamente nesse "roteiro".![](https://img-cdn.gateio.im/social/moments-238eccee24-8529bcb1e0-8b7abd-7649e1)> Previsão do Grok para o jogo Costa do Marfim x NoruegaA vantagem do Grok e do Qwen é analisar os jogos favoritos com mais detalhes. **Eles não escreveram um grande roteiro como o Marrocos eliminar a Holanda, mas em jogos como Canadá, Brasil, Noruega e França, deram previsões de direção e placar muito próximas.** Em outras palavras, eles não são necessariamente os melhores em pegar surpresas, mas são muito bons em avaliar se o time favorito vai passar com facilidade ou vencer por pouco.### ChatGPT não teve muitos placares espetaculares, mas a análise do desenvolvimento do jogo foi mais precisaO ChatGPT não previu tão cedo quanto o Gemini que o Marrocos eliminaria a Holanda nos pênaltis, nem acertou vários placares específicos consecutivos como Grok e Qwen. Mas sua vantagem — em muitos jogos que pareciam ter um favorito claro antes da partida, o ChatGPT alertava de forma mais evidente que o jogo poderia não ser tão fácil.O jogo Brasil x Japão é um exemplo. O ChatGPT previu a classificação do Brasil, mas não escreveu o jogo como uma vitória fácil do Brasil; pelo contrário, mencionou que a pressão, a movimentação e a disciplina do Japão tornariam a partida desconfortável para o Brasil, que poderia até sofrer o primeiro gol ou sofrer o empate. O jogo Costa do Marfim x Noruega foi semelhante: o ChatGPT previu a classificação da Noruega, mas já dizia que não seria um jogo fácil, e que a força física, o ataque pelas laterais e a capacidade de transição da Costa do Marfim causariam problemas.![](https://img-cdn.gateio.im/social/moments-07dbaf57f9-9cd75b16cf-8b7abd-7649e1)> Previsão do ChatGPT para o jogo Inglaterra x República Democrática do CongoO ponto forte do ChatGPT **não é acertar sempre o placar exato, mas sim frequentemente identificar onde estariam as dificuldades do jogo.** Ele é muito adequado para entender a partida, mas não tanto para quem quer apenas um placar final. Ele consegue descrever bem o processo, mas quando se trata de realmente escrever uma grande surpresa, ainda falta um pouco de decisão.### A eliminação da Alemanha foi um fracasso coletivo dos modelos de IASe nos jogos anteriores ainda dava para ver os pontos fortes de diferentes modelos, a partida Alemanha x Paraguai foi um fracasso coletivo.**Antes do jogo, todos os modelos de IA estavam do lado da Alemanha.** ChatGPT, Grok, Qwen, Gemini e Claude ficaram todos com a Alemanha, e os placares previstos variavam entre 2 a 0, 3 a 0 ou 3 a 1. O motivo era o mesmo: todos acreditavam que a Alemanha tinha um elenco mais forte, um elenco mais profundo e maior poder de ataque.Mas o resultado foi problemático. Os modelos de IA subestimaram a capacidade do Paraguai de arrastar o jogo para um ritmo lento. A Alemanha não conseguiu resolver a partida no tempo regulamentar, nem romper o impasse na prorrogação, sendo levada para os pênaltis pelo Paraguai e eliminada.### Quem é o mais preciso até agora?Considerando os jogos eliminatórios já encerrados, as características dos diferentes modelos começaram a aparecer.**DeepSeek e Gemini tiveram os maiores destaques.** Eles não apenas previram a classificação de times favoritos como Brasil e França, mas também deram respostas de alto valor em partidas de surpresa mais difíceis de avaliar. No jogo Holanda x Marrocos, sua vantagem mais crucial foi ousar escrever o roteiro da surpresa do Marrocos e dos pênaltis. Especialmente o Gemini, que previu diretamente a vitória do Marrocos nos pênaltis — esse jogo foi realmente brilhante.**Grok e Qwen são mais "jogadores de placar".** Eles acertaram vários placares específicos, especialmente em jogos como Canadá, Brasil, Noruega e França. Mas o problema é que, diante de seleções tradicionais como Alemanha e Holanda, eles acabaram pendendo para o favorito.**ChatGPT e Claude são mais "jogadores analíticos".** Eles escrevem justificativas completas, a direção geralmente não foge muito e conseguem alertar sobre riscos de prorrogação. Mas o problema é que eles frequentemente percebem que o jogo será difícil, mas não ousam concluir que a surpresa vai acontecer. O jogo Holanda x Marrocos foi assim: eles já viam os riscos de prorrogação e pênaltis, mas no final acreditaram mais na Holanda.Portanto, em vez de se apressar em perguntar qual modelo entende mais de futebol, é melhor ver para quais cenários cada um é mais adequado.> Link para o artigo originalClique para saber sobre as vagas abertas no BlockBeats**Bem-vindo a se juntar à comunidade oficial do BlockBeats:**Grupo de assinatura no Telegram: https://t.me/theblockbeatsGrupo de discussão no Telegram: https://t.me/BlockBeats_AppConta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Prever as eliminatórias da Copa do Mundo, os diferentes níveis de IA diferem tanto assim?

DeepSeek e Gemini, que se destacaram ao prever a partida do Marrocos

Grok e Qwen acertam placares específicos consecutivamente, estabilidade maior do que se imaginava

ChatGPT não teve muitos placares espetaculares, mas a análise do desenvolvimento do jogo foi mais precisa

A eliminação da Alemanha foi um fracasso coletivo dos modelos de IA

Quem é o mais preciso até agora?

Tendências

GateCompletesDividendDistribution

CirclePlunges17%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

WarshEndsForwardGuidance

Fixado