Prever os jogos eliminatórios do Mundial, os diferentes níveis de IA diferem tanto assim?

Título original: «Previsões dos jogos de eliminação do Mundial: modelos de IA com diferenças tão grandes?»
Autor original: Asher, Odaily Planet Daily

Antes de cada jogo do Mundial, peço à IA para fazer uma previsão. Quase todos os modelos falam de forma convincente e cheia de pormenores.

Uns falam do valor das equipas, outros analisam os dados da fase de grupos, outros analisam lesões e táticas, e outros dão diretamente o resultado, prolongamento e penalty shootout. À primeira vista, ChatGPT, Grok, Qianwen, DeepSeek, Gemini, Claude parecem perceber muito de futebol.

Mas, como utilizador de mercados de previsão, o que realmente me interessa não é qual modelo fala de forma mais completa, mas sim aquele que merece mais ser consultado.

À medida que o Mundial entra na fase de eliminação, o Odaily Planet Daily começou desde o primeiro jogo a fazer a mesma pergunta a diferentes modelos de IA antes dos jogos, e depois de cada jogo, confrontou os resultados reais para ver quais modelos apenas analisam bem, e quais realmente captaram o rumo do jogo antecipadamente.

Até agora, nos jogos de eliminação já realizados, o Canadá venceu a África do Sul por 1-0, o Brasil venceu o Japão por 2-1, a Alemanha foi eliminada pelo Paraguai no penalty shootout após o prolongamento, e os Países Baixos também caíram nos penalties frente a Marrocos. No jogo entre Bélgica e Senegal, o jogo foi para 2-2 e depois houve uma reviravolta no prolongamento, elevando ao máximo a incerteza dos jogos de eliminação.

DeepSeek e Gemini, consagrados pela previsão do jogo de Marrocos

Até agora, o momento mais memorável é a previsão do jogo Países Baixos vs. Marrocos pelo DeepSeek e Gemini. Antes deste jogo, era fácil tomar o partido errado — os Países Baixos tinham mais qualidade no papel, o plantel estava mais completo, muitos modelos sabiam que Marrocos não era fácil, mas no final acreditavam mais que os Países Baixos passariam.

O que impressiona no DeepSeek e Gemini é que eles não ficaram pelo "este jogo será muito disputado", mas sim escreveram o guião seguinte. O Gemini deu diretamente o resultado de 1-1 no tempo regulamentar e vitória de Marrocos nos penalties. O jogo acabou mesmo 1-1 e Marrocos venceu os Países Baixos por 3-2 nos penalties. Não acertou só na direção, mas também no facto de o jogo ser arrastado para os penalties e quem riria por último, acertou praticamente tudo.

Previsão do Gemini para o jogo Países Baixos vs. Marrocos

O DeepSeek também esteve perto. Ele previu que o tempo regulamentar provavelmente seria 1-1 ou 0-0, o jogo poderia arrastar-se para o prolongamento e até para os penalties, e inclinou-se para Marrocos conseguir a surpresa com defesa e contra-ataque.

Previsão do DeepSeek para o jogo Países Baixos vs. Marrocos

Depois deste jogo, o DeepSeek e o Gemini ganharam muita notoriedade. Especialmente o Gemini, que desta vez não parecia estar a fazer uma previsão pré-jogo, mas sim a ter visto o guião do jogo antecipadamente.

Grok e Qianwen acertam em cheio nos resultados específicos, estabilidade maior do que se pensava

Além do DeepSeek e Gemini terem tido o seu momento de glória neste jogo de Marrocos, o Grok e o Qianwen também não passaram despercebidos. O seu ponto mais forte foi em alguns jogos onde a direção do vencedor era relativamente clara, não só acertaram na equipa que passava, como também previram o resultado específico de forma muito próxima do resultado final.

O jogo África do Sul vs. Canadá é um exemplo. Antes do jogo, a maioria dos modelos de IA favorecia o Canadá, mas a divergência era se o Canadá venceria facilmente. O Grok previu uma vitória do Canadá por 1-0, e o Qianwen também deu uma vitória por um golo de diferença. No final, o Canadá passou com apenas um golo, sem se tornar na grande vitória que se imaginava.

Previsão do Qianwen para o jogo África do Sul vs. Canadá

O jogo Brasil vs. Japão foi semelhante. A maioria dos modelos de IA achava que o Brasil era mais forte, mas se o Japão conseguiria segurar o jogo era o ponto-chave. O Grok e o Qianwen previram um resultado de 2-1, e o jogo acabou mesmo com o Brasil a vencer por 2-1. Eles não acertaram apenas no "Brasil vai ganhar", mas sim que o Japão daria trabalho suficiente ao Brasil.

O jogo Costa do Marfim vs. Noruega também acertaram em cheio. A Noruega tem Haaland, a direção da qualificação não era difícil de entender, mas a resistência física e o ataque pelas alas da Costa do Marfim não tornariam o jogo unilateral. O Grok e o Qianwen previram uma vitória da Noruega por 2-1, e o resultado final caiu exatamente nesse "guião".

Previsão do Grok para o jogo Costa do Marfim vs. Noruega

A vantagem do Grok e do Qianwen é analisar os jogos favoritos com mais pormenor. Eles não escreveram um grande guião como Marrocos a eliminar os Países Baixos, mas nos jogos do Canadá, Brasil, Noruega, França, etc., deram direções e resultados muito próximos. Por outras palavras, não são necessariamente os melhores a detetar surpresas, mas são bons a avaliar se a equipa favorita vai passar com facilidade ou com dificuldade.

ChatGPT não teve muitos resultados exatos, mas a análise do desenrolar do jogo foi mais precisa

O ChatGPT não previu como o Gemini a eliminação dos Países Baixos por Marrocos nos penalties, nem acertou em tantos resultados específicos como o Grok e o Qianwen. Mas a sua vantagem — em muitos jogos que à partida pareciam favoráveis à equipa mais forte, o ChatGPT avisava de forma mais clara que o jogo poderia não ser tão fácil.

O jogo Brasil vs. Japão é um exemplo. O ChatGPT previu a passagem do Brasil, mas não descreveu o jogo como uma vitória fácil, mencionando que a pressão, movimentação e disciplina do Japão tornariam o jogo desconfortável para o Brasil, e que até poderiam marcar primeiro ou empatar. O jogo Costa do Marfim vs. Noruega foi semelhante: o ChatGPT previu a vitória da Noruega, mas avisou que não seria um jogo fácil, e que a resistência física, ataque pelas alas e capacidade de transição da Costa do Marfim criariam problemas.

Previsão do ChatGPT para o jogo Inglaterra vs. República Democrática do Congo

O ponto forte do ChatGPT não é acertar sempre no resultado, mas sim antecipar frequentemente onde estão as dificuldades do jogo. É ideal para entender o jogo, mas não tanto para quem quer apenas um resultado final. Consegue descrever bem o desenrolar, mas quando se trata de prever uma grande surpresa, falta-lhe um pouco de ousadia.

A eliminação da Alemanha foi um desastre coletivo dos modelos de IA

Se nos jogos anteriores ainda se viam pontos fortes diferentes em cada modelo, no jogo Alemanha vs. Paraguai foi um desastre coletivo.

Antes do jogo, todos os modelos de IA estavam do lado da Alemanha. ChatGPT, Grok, Qianwen, Gemini, Claude estavam todos com a Alemanha, com resultados previstos maioritariamente entre 2-0, 3-0 ou 3-1. O argumento era unânime: todos achavam que a Alemanha tinha mais qualidade no papel, melhor profundidade no plantel e maior poder ofensivo.

Mas o problema aconteceu neste jogo. Os modelos de IA subestimaram a capacidade do Paraguai de arrastar o jogo para um lamaçal. A Alemanha não conseguiu resolver a eliminatória no tempo regulamentar nem no prolongamento, e acabou por ser eliminada pelo Paraguai nos penalties.

Quem é o mais preciso até agora?

Dos jogos de eliminação já realizados, as características dos diferentes modelos começam a evidenciar-se.

DeepSeek e Gemini são os que tiveram os momentos altos. Não se limitaram a prever a qualificação de equipas favoritas como Brasil e França, mas também deram respostas de grande valor em jogos mais difíceis de prever, como as surpresas. No jogo Países Baixos vs. Marrocos, a sua maior vantagem foi ousar escrever antecipadamente o guião da surpresa de Marrocos e dos penalties. Especialmente o Gemini, que previu diretamente a vitória de Marrocos nos penalties, foi um momento brilhante.

Grok e Qianwen são mais "jogadores de resultado". Acertaram em muitos resultados específicos, especialmente nos jogos do Canadá, Brasil, Noruega, França, etc. Mas o problema é que, quando enfrentam equipas tradicionalmente fortes como Alemanha e Países Baixos, acabam por pender para o favorito.

ChatGPT e Claude são mais "jogadores de análise". Escrevem argumentos completos, a direção está quase sempre correta e também alertam para alguns riscos de prolongamento. No entanto, o problema é que frequentemente percebem que o jogo será difícil, mas não se atrevem a concluir do lado da surpresa. No jogo Países Baixos vs. Marrocos foi assim: mesmo vendo o risco de prolongamento e penalties, acabaram por acreditar mais nos Países Baixos.

Portanto, em vez de perguntar qual modelo percebe mais de futebol, é melhor ver para que cenários cada um é mais adequado.

Link original

Clique para saber mais sobre as vagas do BlockBeats

Bem-vindo a juntar-te à comunidade oficial do BlockBeats:

Grupo de subscrição no Telegram: https://t.me/theblockbeats

Grupo de discussão no Telegram: https://t.me/BlockBeats_App

Conta oficial no Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado