Prever as eliminatórias da Copa do Mundo, os níveis de IA são tão diferentes assim?

robot
Geração do resumo em andamento

Original | Odaily Planet Daily (@OdailyChina)

Autor | Asher (@Asher 0210)_

Antes de cada jogo da Copa do Mundo, peço à IA para fazer previsões, e quase todos os modelos falam com tanta convicção e cheios de detalhes.

Alguns falam sobre o valor do elenco, outros analisam dados da fase de grupos, outros examinam lesões e táticas, e alguns até dão palpites sobre placar, prorrogação e pênaltis. À primeira vista, ChatGPT, Grok, Qwen, DeepSeek, Gemini e Claude parecem entender muito de futebol.

Mas, como usuário de mercado de previsões, o que realmente me importa não é qual modelo fala de forma mais completa, mas sim qual é mais confiável.

Com a Copa entrando na fase eliminatória, o Odaily Planet Daily, desde o primeiro jogo, fez a mesma pergunta para diferentes modelos de IA antes das partidas e, depois, comparou com os resultados reais para ver quais modelos apenas pareciam ter uma boa análise e quais realmente captaram o rumo do jogo com antecedência.

Até agora, nos jogos eliminatórios já concluídos, Canadá venceu a África do Sul por 1 a 0 em um gol decisivo, Brasil venceu o Japão por 2 a 1 de forma apertada, Alemanha foi eliminada após ser levada aos pênaltis pelo Paraguai, e a Holanda também caiu nos pênaltis para Marrocos. Já no jogo Bélgica contra Senegal, o placar foi para 2 a 2 e depois virou na prorrogação, elevando ao máximo a imprevisibilidade da fase eliminatória.

DeepSeek e Gemini, previsão de Marrocos as consagrou

Até agora, o que mais marcou foi a previsão de DeepSeek e Gemini para o jogo Holanda vs Marrocos. Antes desse jogo, era fácil escolher o lado errado — a Holanda tinha um elenco tecnicamente mais forte e mais completo, muitos modelos sabiam que Marrocos não seria fácil, mas no final acreditavam mais na vitória da Holanda.

O que fez DeepSeek e Gemini se destacarem é que elas não pararam no "esse jogo será muito disputado", mas foram além e escreveram o roteiro completo. Gemini previu diretamente um 1 a 1 no tempo normal e Marrocos vencendo nos pênaltis. E o resultado foi exatamente 1 a 1, com Marrocos eliminando a Holanda por 3 a 2 nos pênaltis. Não apenas acertaram o vencedor, mas também acertaram como o jogo seria levado aos pênaltis e quem sairia vitorioso.

Previsão do Gemini para o jogo Holanda vs Marrocos

DeepSeek também chegou perto. Ela avaliou que o tempo normal provavelmente terminaria em 1 a 1 ou 0 a 0, e que o jogo poderia se estender até a prorrogação ou pênaltis, tendendo a favorecer Marrocos, que avançaria com uma surpresa baseada em defesa e contra-ataques.

Previsão do DeepSeek para o jogo Holanda vs Marrocos

Depois desse jogo, a presença de DeepSeek e Gemini disparou. Especialmente o Gemini, que pareceu menos uma previsão e mais como se já tivesse lido o roteiro do jogo.

Grok e Qwen acertaram placares específicos consecutivamente, estabilidade maior do que se imaginava

Além de DeepSeek e Gemini terem brilhado no jogo de Marrocos, Grok e Qwen também não ficaram atrás. O destaque delas foi que, em jogos com direção mais clara, não apenas acertaram a equipe que avançou, mas também previram o placar específico de forma muito próxima do resultado final.

O jogo África do Sul vs Canadá é um exemplo. Antes do jogo, a maioria dos modelos de IA favorecia o Canadá, mas a dúvida era se o Canadá venceria com facilidade. Grok previu Canadá 1 a 0, e Qwen também deu uma vitória por um gol de diferença. No final, o Canadá realmente passou com apenas um gol, sem a grande goleada imaginada.

Previsão do Qwen para o jogo África do Sul vs Canadá

O jogo Brasil vs Japão foi semelhante. A maioria dos modelos de IA achava o Brasil mais forte, mas a chave era se o Japão conseguiria segurar o jogo. Grok e Qwen previram um placar de 2 a 1, e o jogo realmente terminou com o Brasil vencendo por 2 a 1 de forma apertada. O que elas acertaram não foi apenas "Brasil vence", mas que o Japão causaria problemas suficientes ao Brasil.

No jogo Costa do Marfim vs Noruega, ambas também acertaram bem. A Noruega tem Haaland, e a direção da classificação não era difícil de entender, mas a força física e os ataques pelos lados da Costa do Marfim não deixariam o jogo ser unilateral. Grok e Qwen previram Noruega 2 a 1, e o placar final caiu exatamente nesse "roteiro".

Previsão do Grok para o jogo Costa do Marfim vs Noruega

A vantagem de Grok e Qwen é analisar jogos favoritos com mais detalhes. Elas não escreveram grandes roteiros como Marrocos eliminando a Holanda, mas em jogos como Canadá, Brasil, Noruega e França, os resultados e os placares foram bem próximos. Em outras palavras, elas podem não ser as melhores em detectar zebras, mas são muito boas em determinar se um time favorito vai atropelar ou vencer com dificuldade.

ChatGPT não teve muitos placares surpreendentes, mas sua análise do desenrolar do jogo foi mais precisa

O ChatGPT não previu como o Gemini que Marrocos eliminaria a Holanda nos pênaltis, nem acertou vários placares específicos como Grok e Qwen. Mas sua vantagem — em muitos jogos que pareciam dominados por times favoritos, o ChatGPT destacava mais claramente que o jogo poderia não ser tão fácil.

O jogo Brasil vs Japão é um exemplo. O ChatGPT previu a classificação do Brasil, mas não escreveu que seria uma vitória fácil; mencionou que a pressão, a movimentação e a disciplina do Japão poderiam deixar o Brasil desconfortável, e até que o Japão poderia marcar primeiro ou empatar. No jogo Costa do Marfim vs Noruega, foi semelhante: o ChatGPT previu a classificação da Noruega, mas alertou que não seria um jogo fácil, e que a força física, os ataques pelos lados e a capacidade de transição da Costa do Marfim criariam problemas.

Além disso, no jogo eliminatório Inglaterra vs República Democrática do Congo, o ChatGPT não escreveu simplesmente que a Inglaterra venceria com folga; achou que o jogo poderia ser monótono, com a República Democrática do Congo usando uma defesa baixa para segurar o ritmo. No final, a Inglaterra avançou, mas não foi fácil.

Previsão do ChatGPT para o jogo Inglaterra vs República Democrática do Congo

O ponto forte do ChatGPT não é acertar placares sempre, mas frequentemente identificar onde estão as dificuldades do jogo com antecedência. É muito útil para entender o jogo, mas não é o melhor para quem quer apenas um placar final. Ele consegue descrever o processo com precisão, mas quando se trata de prever grandes zebras, falta um pouco de decisão.

Eliminação da Alemanha, o grande fiasco coletivo dos modelos de IA

Se nos jogos anteriores ainda era possível ver os destaques de cada modelo, o jogo Alemanha vs Paraguai foi um fiasco coletivo.

Antes do jogo, todos os modelos de IA estavam do lado da Alemanha. ChatGPT, Grok, Qwen, Gemini, Claude — todos ficaram com a Alemanha, com placares previstos geralmente em 2 a 0, 3 a 0 ou 3 a 1. O motivo era unânime: todos achavam que a Alemanha tinha um elenco mais forte, mais profundidade no banco e mais poder ofensivo.

Mas o resultado foi esse problema. Os modelos de IA subestimaram a capacidade do Paraguai de levar o jogo para um lamaçal; a Alemanha não conseguiu resolver no tempo normal, nem quebrar o impasse na prorrogação, e acabou sendo levada aos pênaltis e eliminada.

Quem é o mais preciso até agora?

Pelos jogos eliminatórios já concluídos, as características de cada modelo começam a aparecer.

DeepSeek e Gemini tiveram o maior destaque. Elas não apenas preveem a classificação de favoritos como Brasil e França, mas em jogos mais difíceis de avaliar, também deram respostas de alto valor. No jogo Holanda vs Marrocos, a principal vantagem delas foi ousar escrever o roteiro de zebra e pênaltis de Marrocos. Especialmente o Gemini, que previu diretamente a classificação de Marrocos nos pênaltis — esse jogo realmente foi brilhante.

Grok e Qwen são mais como "especialistas em placares". Elas acertaram vários placares específicos, especialmente em jogos como Canadá, Brasil, Noruega e França. Mas o problema é que, quando enfrentam times tradicionais como Alemanha e Holanda, no final ainda favorecem os favoritos.

ChatGPT e Claude são mais como "especialistas em análise". Escrevem argumentos completos, a direção geralmente não foge muito, e conseguem alertar sobre riscos de prorrogação. Mas o problema é que frequentemente percebem que o jogo será difícil, mas não ousam concluir pelo lado da zebra. No jogo Holanda vs Marrocos foi assim — já viram o risco de prorrogação e pênaltis, mas no final ainda apostaram na Holanda.

Portanto, em vez de perguntar qual modelo entende mais de futebol, é melhor ver para qual cenário cada um é mais adequado.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado