Prever as eliminatórias da Copa do Mundo, os diferentes níveis de IA diferem tanto assim?

Título original: "Previsão dos jogos eliminatórios da Copa do Mundo: será que diferentes IAs têm tanta diferença assim?" Autor original: Asher, Odaily Planet Daily

Antes de cada partida da Copa do Mundo, peço uma previsão à IA. Quase todos os modelos falam com muita convicção e cheios de detalhes.

Alguns falam sobre o valor do elenco, outros analisam dados da fase de grupos, alguns discutem lesões e táticas, e outros ainda dão diretamente o placar, prorrogação e pênaltis. À primeira vista, ChatGPT, Grok, Qwen, DeepSeek, Gemini e Claude parecem entender muito de futebol.

Mas, como usuário do mercado de previsões, o que realmente me importa não é qual modelo fala de forma mais completa, mas sim qual é mais confiável.

Com a Copa do Mundo entrando na fase eliminatória, o Odaily Planet Daily começou desde o primeiro jogo, fazendo a mesma pergunta, o mais idêntica possível, a diferentes modelos de IA antes das partidas, e depois, após os jogos, comparou com os resultados reais — quais modelos apenas pareciam fazer análises convincentes e quais realmente captaram a direção do jogo antecipadamente.

Atualmente, nos jogos eliminatórios já encerrados da Copa, o Canadá venceu a África do Sul por 1 a 0, o Brasil venceu o Japão por 2 a 1, a Alemanha foi eliminada pelo Paraguai após levar o jogo para os pênaltis, e a Holanda também caiu diante dos pênaltis do Marrocos. No jogo entre Bélgica e Senegal, a partida terminou em 2 a 2 e teve uma virada na prorrogação, elevando ao máximo a imprevisibilidade da fase eliminatória.

DeepSeek e Gemini, que se destacaram ao prever a partida do Marrocos

Atualmente, o mais memorável é a previsão de DeepSeek e Gemini para o jogo Holanda x Marrocos. Antes desta partida, era fácil escolher o lado errado — a Holanda tinha um elenco teoricamente mais forte e mais completo. Muitos modelos sabiam que o Marrocos não seria fácil, mas no final, acreditavam mais que a Holanda passaria.

O ponto forte do DeepSeek e do Gemini é que eles não pararam no "este jogo será muito disputado", mas sim escreveram o roteiro completo. O Gemini previu diretamente antes do jogo um empate por 1 a 1 no tempo regulamentar e vitória do Marrocos nos pênaltis. O resultado? O jogo realmente terminou 1 a 1 e, nos pênaltis, o Marrocos venceu a Holanda por 3 a 2. Não foi apenas acertar o lado, mas acertar como o jogo seria levado aos pênaltis e quem sairia vitorioso.

Previsão do Gemini para o jogo Holanda x Marrocos

O DeepSeek também chegou perto. Ele avaliou que o tempo regulamentar provavelmente terminaria em 1 a 1 ou 0 a 0, e que o jogo poderia ser levado para a prorrogação e até para os pênaltis, inclinando-se para uma surpresa do Marrocos, com defesa e contra-ataque.

Previsão do DeepSeek para o jogo Holanda x Marrocos

Depois dessa partida, a presença do DeepSeek e do Gemini foi imediatamente destacada. Especialmente o Gemini, que não parecia estar apenas fazendo uma previsão antes do jogo, mas sim que já tinha visto o roteiro da partida.

Grok e Qwen acertam placares específicos consecutivamente, estabilidade maior do que se imaginava

Além do DeepSeek e do Gemini terem se destacado no jogo do Marrocos, Grok e Qwen também não ficaram para trás. O ponto mais brilhante deles é que, em algumas partidas onde a direção do resultado era relativamente clara, eles não apenas acertaram o time classificado, mas também previram o placar específico de forma muito próxima do resultado final.

A partida entre África do Sul e Canadá é um exemplo. Antes do jogo, a maioria dos modelos de IA favorecia o Canadá, mas a divergência estava em saber se o Canadá venceria com facilidade. O Grok previu uma vitória do Canadá por 1 a 0, e o Qwen também deu uma vitória por um gol de diferença. No final, o Canadá realmente passou com apenas um gol, sem a grande goleada que se imaginava.

Previsão do Qwen para o jogo África do Sul x Canadá

O jogo entre Brasil e Japão foi semelhante. A maioria dos modelos de IA achava que o Brasil era mais forte, mas se o Japão conseguiria segurar o jogo era o ponto crucial. Grok e Qwen previram um placar de 2 a 1, e o jogo realmente terminou com o Brasil vencendo por 2 a 1. O que eles acertaram não foi apenas "o Brasil vai vencer", mas sim que o Japão conseguiria causar problemas suficientes ao Brasil.

No jogo entre Costa do Marfim e Noruega, ambos também acertaram bem. A Noruega tem Haaland, e a direção da classificação não era difícil de entender, mas a força física e o ataque pelas laterais da Costa do Marfim não deixariam o jogo ser uma via de mão única. Grok e Qwen previram uma vitória da Noruega por 2 a 1, e o placar final caiu exatamente nesse "roteiro".

Previsão do Grok para o jogo Costa do Marfim x Noruega

A vantagem do Grok e do Qwen é analisar os jogos favoritos com mais detalhes. Eles não escreveram um grande roteiro como o Marrocos eliminar a Holanda, mas em jogos como Canadá, Brasil, Noruega e França, deram previsões de direção e placar muito próximas. Em outras palavras, eles não são necessariamente os melhores em pegar surpresas, mas são muito bons em avaliar se o time favorito vai passar com facilidade ou vencer por pouco.

ChatGPT não teve muitos placares espetaculares, mas a análise do desenvolvimento do jogo foi mais precisa

O ChatGPT não previu tão cedo quanto o Gemini que o Marrocos eliminaria a Holanda nos pênaltis, nem acertou vários placares específicos consecutivos como Grok e Qwen. Mas sua vantagem — em muitos jogos que pareciam ter um favorito claro antes da partida, o ChatGPT alertava de forma mais evidente que o jogo poderia não ser tão fácil.

O jogo Brasil x Japão é um exemplo. O ChatGPT previu a classificação do Brasil, mas não escreveu o jogo como uma vitória fácil do Brasil; pelo contrário, mencionou que a pressão, a movimentação e a disciplina do Japão tornariam a partida desconfortável para o Brasil, que poderia até sofrer o primeiro gol ou sofrer o empate. O jogo Costa do Marfim x Noruega foi semelhante: o ChatGPT previu a classificação da Noruega, mas já dizia que não seria um jogo fácil, e que a força física, o ataque pelas laterais e a capacidade de transição da Costa do Marfim causariam problemas.

Previsão do ChatGPT para o jogo Inglaterra x República Democrática do Congo

O ponto forte do ChatGPT não é acertar sempre o placar exato, mas sim frequentemente identificar onde estariam as dificuldades do jogo. Ele é muito adequado para entender a partida, mas não tanto para quem quer apenas um placar final. Ele consegue descrever bem o processo, mas quando se trata de realmente escrever uma grande surpresa, ainda falta um pouco de decisão.

A eliminação da Alemanha foi um fracasso coletivo dos modelos de IA

Se nos jogos anteriores ainda dava para ver os pontos fortes de diferentes modelos, a partida Alemanha x Paraguai foi um fracasso coletivo.

Antes do jogo, todos os modelos de IA estavam do lado da Alemanha. ChatGPT, Grok, Qwen, Gemini e Claude ficaram todos com a Alemanha, e os placares previstos variavam entre 2 a 0, 3 a 0 ou 3 a 1. O motivo era o mesmo: todos acreditavam que a Alemanha tinha um elenco mais forte, um elenco mais profundo e maior poder de ataque.

Mas o resultado foi problemático. Os modelos de IA subestimaram a capacidade do Paraguai de arrastar o jogo para um ritmo lento. A Alemanha não conseguiu resolver a partida no tempo regulamentar, nem romper o impasse na prorrogação, sendo levada para os pênaltis pelo Paraguai e eliminada.

Quem é o mais preciso até agora?

Considerando os jogos eliminatórios já encerrados, as características dos diferentes modelos começaram a aparecer.

DeepSeek e Gemini tiveram os maiores destaques. Eles não apenas previram a classificação de times favoritos como Brasil e França, mas também deram respostas de alto valor em partidas de surpresa mais difíceis de avaliar. No jogo Holanda x Marrocos, sua vantagem mais crucial foi ousar escrever o roteiro da surpresa do Marrocos e dos pênaltis. Especialmente o Gemini, que previu diretamente a vitória do Marrocos nos pênaltis — esse jogo foi realmente brilhante.

Grok e Qwen são mais "jogadores de placar". Eles acertaram vários placares específicos, especialmente em jogos como Canadá, Brasil, Noruega e França. Mas o problema é que, diante de seleções tradicionais como Alemanha e Holanda, eles acabaram pendendo para o favorito.

ChatGPT e Claude são mais "jogadores analíticos". Eles escrevem justificativas completas, a direção geralmente não foge muito e conseguem alertar sobre riscos de prorrogação. Mas o problema é que eles frequentemente percebem que o jogo será difícil, mas não ousam concluir que a surpresa vai acontecer. O jogo Holanda x Marrocos foi assim: eles já viam os riscos de prorrogação e pênaltis, mas no final acreditaram mais na Holanda.

Portanto, em vez de se apressar em perguntar qual modelo entende mais de futebol, é melhor ver para quais cenários cada um é mais adequado.

Link para o artigo original

Clique para saber sobre as vagas abertas no BlockBeats

Bem-vindo a se juntar à comunidade oficial do BlockBeats:

Grupo de assinatura no Telegram: https://t.me/theblockbeats

Grupo de discussão no Telegram: https://t.me/BlockBeats_App

Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado