Prever os jogos eliminatórios do Mundial, diferentes níveis de IA diferem tanto?

robot
Geração de resumo em curso

Original | Odaily Planet Daily (@OdailyChina)

Autoria: Asher (@Asher 0210)_

Antes de cada jogo do Mundial, peço ao AI para fazer uma previsão, e quase todos os modelos falam com grande segurança e muitos detalhes.

Uns falam sobre o valor das equipas, outros analisam os dados da fase de grupos, outros estudam lesões e táticas, e há ainda quem dê diretamente o resultado, prolongamento e penáltis. À primeira vista, ChatGPT, Grok, Qwen, DeepSeek, Gemini, Claude parecem perceber muito de futebol.

Mas, enquanto utilizador do mercado de previsões, o que realmente me interessa não é qual modelo fala de forma mais completa, mas sim qual merece mais confiança.

Com o Mundial a entrar na fase a eliminar, a Odaily Planet Daily, desde o primeiro jogo, fez a mesma pergunta a diferentes modelos de AI antes de cada jogo e, após o jogo, comparou com os resultados reais para ver quais modelos apenas pareciam fazer análises credíveis e quais realmente anteciparam o rumo do jogo.

Até agora, nos jogos a eliminar já realizados, Canadá venceu a África do Sul por 1-0, Brasil derrotou o Japão por 2-1, Alemanha foi eliminada após ser levada para penáltis pelo Paraguai, e os Países Baixos também caíram nos penáltis frente a Marrocos. Quanto ao jogo Bélgica vs Senegal, terminou 2-2 após prolongamento, elevando ao máximo a imprevisibilidade da fase a eliminar.

DeepSeek e Gemini, consagrados pela previsão do jogo de Marrocos

O momento mais memorável até agora é a previsão de DeepSeek e Gemini para o jogo Países Baixos vs Marrocos. Antes do jogo, era fácil escolher o lado errado - os Países Baixos tinham um plantel mais forte no papel e um elenco mais completo. Muitos modelos sabiam que Marrocos não seria fácil, mas no final acreditavam mais que os Países Baixos passariam.

O que torna DeepSeek e Gemini impressionantes é que não se limitaram a dizer "este jogo vai ser renhido", mas sim escreveram o guião até ao fim. Gemini previu diretamente 1-1 no tempo regulamentar e vitória de Marrocos nos penáltis. O jogo acabou mesmo 1-1 e Marrocos eliminou os Países Baixos por 3-2 nos penáltis. Não apenas acertaram na direção, mas também acertaram basicamente na forma como o jogo iria para penáltis e quem riria por último.

Previsão do Gemini para o jogo Países Baixos vs Marrocos

DeepSeek também esteve muito perto. Previu que o tempo regulamentar seria provavelmente 1-1 ou 0-0, o jogo poderia prolongar-se para prolongamento ou mesmo penáltis, e inclinou-se para Marrocos avançar por surpresa com defesa e contra-ataque.

Previsão do DeepSeek para o jogo Países Baixos vs Marrocos

Após este jogo, a presença de DeepSeek e Gemini disparou. Especialmente Gemini, que não pareceu estar a fazer uma previsão antes do jogo, mas sim a ter visto o guião do jogo antecipadamente.

Grok e Qwen acertam consecutivamente em resultados exatos, estabilidade maior do que se esperava

Além de DeepSeek e Gemini terem brilhado no jogo de Marrocos, Grok e Qwen também não passaram despercebidos. O seu ponto mais forte foi que, em jogos com direções de vitória relativamente claras, não só acertaram na equipa que avançou, como também previram resultados exatos bastante próximos do resultado final.

O jogo África do Sul vs Canadá é um exemplo. Antes do jogo, a maioria dos modelos de AI favorecia o Canadá, mas a divergência estava em saber se o Canadá ganharia facilmente. Grok previu vitória do Canadá por 1-0, e Qwen também previu uma vitória por um golo de diferença. No final, o Canadá passou com apenas um golo, sem a grande vitória que se imaginava.

Previsão do Qwen para o jogo África do Sul vs Canadá

O jogo Brasil vs Japão foi semelhante. A maioria dos modelos de AI achava o Brasil mais forte, mas o segredo estava em saber se o Japão conseguiria segurar o jogo. Grok e Qwen previram ambos 2-1, e o jogo acabou mesmo com o Brasil a vencer por 2-1. O que acertaram não foi apenas "o Brasil vai ganhar", mas sim que o Japão conseguiria causar problemas suficientes ao Brasil.

O jogo Costa do Marfim vs Noruega também foi bem acertado por ambos. A Noruega tem Haaland, a direção da qualificação não era difícil de perceber, mas a força física e o impacto pelos flancos da Costa do Marfim não deixariam o jogo ser unilateral. Grok e Qwen previram ambos vitória da Noruega por 2-1, e o resultado final encaixou perfeitamente nesse "guião".

Previsão do Grok para o jogo Costa do Marfim vs Noruega

A vantagem de Grok e Qwen é analisar com mais detalhe os jogos favoritos. Não escreveram grandes guiões como Marrocos a eliminar os Países Baixos, mas nos jogos do Canadá, Brasil, Noruega, França, etc., acertaram na direção da vitória e no resultado exato. Por outras palavras, não são os melhores a detetar surpresas, mas são muito bons a determinar se a equipa favorita vai ganhar de forma avassaladora ou com uma vitória suada.

ChatGPT não tem resultados exatos espetaculares, mas análise do desenrolar do jogo é mais precisa

O ChatGPT não previu tão cedo como o Gemini que Marrocos eliminaria os Países Baixos nos penáltis, nem acertou consecutivamente em resultados exatos como Grok e Qwen. Mas a sua vantagem - em muitos jogos que à partida pareciam favoráveis à equipa forte, o ChatGPT avisava mais claramente que talvez não fosse tão fácil.

O jogo Brasil vs Japão é um exemplo. O ChatGPT previu o Brasil a avançar, mas não o descreveu como uma vitória fácil; em vez disso, mencionou que a pressão, a corrida e a disciplina do Japão tornariam o jogo desconfortável para o Brasil, e que o Japão poderia até marcar primeiro ou empatar. O jogo Costa do Marfim vs Noruega foi semelhante: o ChatGPT previu a Noruega a avançar, mas avisou que não seria fácil, e que a força física, o impacto pelos flancos e a capacidade de transição da Costa do Marfim criariam problemas.

Além disso, no jogo a eliminar Inglaterra vs República Democrática do Congo, o ChatGPT não disse simplesmente que a Inglaterra ganharia por goleada; considerou que o jogo poderia ser aborrecido, com a RDC a travar o ritmo com defesa baixa. No final, a Inglaterra avançou, mas não foi fácil.

Previsão do ChatGPT para o jogo Inglaterra vs República Democrática do Congo

O ponto forte do ChatGPT não é acertar sempre no resultado exato, mas sim prever frequentemente onde estão as dificuldades do jogo. É bom para compreender o jogo, mas não tanto para dar apenas um resultado final. Consegue descrever bem o desenrolar, mas quando se trata de escrever uma grande surpresa, falta-lhe um pouco de determinação.

A eliminação da Alemanha, um fracasso coletivo dos modelos de AI

Se nos jogos anteriores se podiam ver os pontos fortes de cada modelo, o jogo Alemanha vs Paraguai foi um fracasso coletivo.

Antes do jogo, todos os modelos de AI estavam do lado da Alemanha. ChatGPT, Grok, Qwen, Gemini, Claude - todos apoiavam a Alemanha, com previsões de resultados maioritariamente 2-0, 3-0 ou 3-1. As razões eram consistentes: todos consideravam a Alemanha mais forte no papel, com melhor profundidade de plantel e maior poder ofensivo.

Mas o resultado foi diferente. Os modelos de AI subestimaram a capacidade do Paraguai de arrastar o jogo para um atoleiro; a Alemanha não conseguiu resolver o jogo no tempo regulamentar, nem quebrar o impasse no prolongamento, e acabou por ser eliminada nos penáltis.

Quem é mais preciso até agora?

Com base nos jogos a eliminar já realizados, as características dos diferentes modelos começam a emergir.

DeepSeek e Gemini têm os momentos mais brilhantes. Não só preveem a qualificação de favoritos como Brasil e França, como também deram respostas de alto valor em jogos de surpresa mais difíceis de prever. No jogo Países Baixos vs Marrocos, a sua maior vantagem foi ousar escrever o guião da surpresa de Marrocos e dos penáltis. Especialmente Gemini, que previu diretamente a vitória de Marrocos nos penáltis - um feito impressionante.

Grok e Qwen são mais "jogadores de resultados exatos". Acertaram em vários resultados exatos, especialmente nos jogos do Canadá, Brasil, Noruega, França, etc. No entanto, o problema é que, quando encontram equipas tradicionais como Alemanha e Países Baixos, acabam por pender para os favoritos.

ChatGPT e Claude são mais "jogadores analíticos". Escrevem argumentos completos, a direção geralmente não é absurda e conseguem alertar para riscos de prolongamento. Mas o problema é que frequentemente veem que o jogo não vai ser fácil, mas não ousam concluir a favor da surpresa. O jogo Países Baixos vs Marrocos foi assim: já viam o risco de prolongamento e penáltis, mas no final acreditavam mais nos Países Baixos.

Portanto, em vez de perguntar qual modelo percebe mais de futebol, é melhor ver para que situações cada um é adequado.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado