Prédire les matchs à élimination directe de la Coupe du monde, les niveaux d'IA sont-ils si différents ?

Titre original : « Prédire les matchs à élimination directe de la Coupe du Monde, à quel point les différentes IA diffèrent-elles ? »
Auteur original : Asher, Odaily Planet Daily

Avant chaque match de la Coupe du Monde, je fais prédire le résultat par une IA. Presque tous les modèles s’expriment de manière très persuasive, avec force détails.

Certains parlent de la valeur des équipes, d’autres analysent les données des phases de groupes, certains étudient les blessures et les tactiques, et d’autres encore donnent directement le score, les prolongations, et le scénario des tirs au but. À première vue, ChatGPT, Grok, Qianwen, DeepSeek, Gemini et Claude semblent tous très calés en football.

Mais en tant qu’utilisateur de marchés prédictifs, ce qui m’intéresse vraiment, ce n’est pas quel modèle s’exprime le plus complètement, mais lequel est le plus fiable.

Alors que la Coupe du Monde entre dans sa phase à élimination directe, Odaily Planet Daily a posé, avant chaque match, les mêmes questions à différents modèles d’IA, puis a comparé les résultats réels après le match – pour voir quels modèles ne faisaient que paraître pertinents, et lesquels avaient réellement anticipé l’évolution du match.

À ce jour, les matchs à élimination directe déjà disputés : le Canada a battu l’Afrique du Sud 1-0 dans les dernières minutes, le Brésil a battu le Japon 2-1, l’Allemagne a été éliminée après avoir été poussée aux tirs au but par le Paraguay, et les Pays-Bas sont également tombés sous les tirs au but du Maroc. Quant à la Belgique contre le Sénégal, le match s’est terminé sur un renversement après prolongations, après un score de 2-2, portant l’incertitude des matchs à élimination directe à son comble.

DeepSeek et Gemini, élevés au rang de dieux grâce à leur prédiction du match Maroc

Le plus marquant jusqu’à présent reste la prédiction de DeepSeek et Gemini pour le match Pays-Bas vs Maroc. Avant ce match, il était facile de se tromper de camp – les Pays-Bas avaient une équipe plus forte sur le papier et un effectif plus complet. De nombreux modèles savaient que le Maroc serait difficile à jouer, mais finissaient par faire confiance aux Pays-Bas pour passer.

Ce qui distingue DeepSeek et Gemini, c’est qu’ils ne se sont pas arrêtés à « ce match sera serré », mais ont également écrit la suite du scénario. Gemini a directement prédit un score de 1-1 dans le temps réglementaire, et une victoire du Maroc aux tirs au but. Le match s’est effectivement terminé sur un 1-1, et le Maroc a éliminé les Pays-Bas 3-2 aux tirs au but. Ce n’est pas seulement la direction qui était juste, mais aussi la manière dont le match serait poussé aux tirs au but, et qui finirait par sourire, qui correspondait presque parfaitement.

Prédiction de Gemini pour le match Pays-Bas vs Maroc

DeepSeek était également très proche. Il a estimé que le temps réglementaire serait probablement 1-1 ou 0-0, que le match pourrait s’étendre jusqu’aux prolongations et même aux tirs au but, et a penché pour une qualification surprise du Maroc grâce à une défense solide et des contres.

Prédiction de Deepseek pour le match Pays-Bas vs Maroc

Après ce match, la présence de DeepSeek et Gemini s’est directement imposée. Surtout Gemini, qui ne semblait pas faire une prédiction, mais avoir déjà vu le scénario du match.

Grok et Qianwen enchaînent les scores exacts, leur stabilité est plus forte que prévu

Outre DeepSeek et Gemini qui ont brillé sur le match du Maroc, Grok et Qianwen ne sont pas en reste. Leur point fort est que, dans certains matchs où le vainqueur était relativement clair, ils n’ont pas seulement deviné l’équipe qualifiée, mais aussi prédit le score exact avec une assez bonne précision.

Le match Afrique du Sud vs Canada en est un exemple. Avant le match, la plupart des modèles d’IA penchaient pour le Canada, mais la question était de savoir si le Canada gagnerait facilement. Grok avait prédit une victoire 1-0 du Canada, et Qianwen avait également évoqué une victoire par un but d’écart. Au final, le Canada s’est imposé sur un seul but, sans la large victoire imaginée.

Prédiction de Qianwen pour le match Afrique du Sud vs Canada

Le match Brésil vs Japon était similaire. La plupart des modèles d’IA pensaient que le Brésil était plus fort, mais la question clé était de savoir si le Japon parviendrait à tenir le match. Grok et Qianwen ont tous deux prédit un score de 2-1, et le match s’est effectivement terminé sur une victoire difficile du Brésil 2-1. Ils n’ont pas simplement vu juste sur « le Brésil gagnera », mais aussi sur le fait que le Japon poserait suffisamment de problèmes au Brésil.

Le match Côte d’Ivoire vs Norvège a également bien été évalué par les deux. La Norvège avait Haaland, la direction de la qualification était compréhensible, mais l’impact physique et les percées sur les ailes de la Côte d’Ivoire n’allaient pas faire du match une promenade. Grok et Qianwen ont tous deux prédit une victoire 2-1 de la Norvège, et le score final a été exactement ce « scénario ».

Prédiction de Gork pour le match Côte d’Ivoire vs Norvège

L’avantage de Grok et Qianwen est de détailler davantage les matchs favoris. Ils n’ont pas anticipé de grands scénarios comme l’élimination des Pays-Bas par le Maroc, mais dans les matchs du Canada, du Brésil, de la Norvège, de la France, etc., ils ont donné une direction et un score assez proches. En d’autres termes, ils ne sont pas les meilleurs pour déceler les surprises, mais ils excellent à juger si l’équipe favorite va écraser ou gagner difficilement.

ChatGPT n’a pas de score parfait, mais son analyse du déroulement du match est assez précise

ChatGPT n’a pas prédit à l’avance l’élimination des Pays-Bas par le Maroc aux tirs au but comme Gemini, ni enchaîné plusieurs scores exacts comme Grok et Qianwen. Mais son avantage – pour de nombreux matchs, avant le coup d’envoi, l’équipe favorite semblait dominer, mais ChatGPT rappelait plus clairement que ce match ne serait pas si facile.

Le match Brésil vs Japon en est un exemple. ChatGPT a prédit la qualification du Brésil, mais n’a pas écrit un match de domination brésilienne facile. Il a plutôt mentionné que la pression, la course et la discipline du Japon mettraient le Brésil mal à l’aise, et qu’ils pourraient même marquer en premier ou égaliser. Le match Côte d’Ivoire vs Norvège était similaire : ChatGPT a prédit la qualification de la Norvège, mais a précisé à l’avance que ce ne serait pas un match facile, que l’impact physique, les percées sur les ailes et la capacité de transition de la Côte d’Ivoire poseraient des problèmes.

Prédiction de ChatGPT pour le match Angleterre vs République Démocratique du Congo

La force de ChatGPT n’est pas de prédire le score avec une grande précision à chaque fois, mais de souvent indiquer à l’avance les résistances du match. Il est très adapté pour comprendre un match, mais moins pour donner un score final précis. Il peut décrire le déroulement assez justement, mais lorsqu’il s’agit d’écrire une grosse surprise, il manque un peu de détermination.

L’élimination de l’Allemagne, un fiasco collectif pour les modèles d’IA

Si les matchs précédents montraient encore les forces respectives des différents modèles, alors le match Allemagne vs Paraguay a été un fiasco collectif.

Avant le match, tous les modèles d’IA étaient du côté de l’Allemagne. ChatGPT, Grok, Qianwen, Gemini, Claude – tous penchaient pour l’Allemagne, avec des scores prédits allant de 2-0, 3-0 à 3-1. Le raisonnement était unanime : l’Allemagne avait une équipe plus forte sur le papier, un effectif plus profond et une attaque plus puissante.

Mais le résultat a été tout autre. Les modèles d’IA ont sous-estimé la capacité du Paraguay à entraîner le match dans une boue. L’Allemagne n’a pas réussi à se défaire de son adversaire dans le temps réglementaire, ni à briser l’impasse en prolongations, et a finalement été poussée aux tirs au but et éliminée.

Qui est le plus précis actuellement ?

Après les matchs à élimination directe déjà disputés, les caractéristiques des différents modèles commencent à se dégager.

DeepSeek et Gemini sont les plus en vue. Ils ne se contentent pas de prédire la qualification de favoris comme le Brésil ou la France, mais dans des matchs plus difficiles à juger, ils fournissent des réponses de grande valeur. Le match Pays-Bas vs Maroc est l’exemple parfait : leur avantage clé a été d’oser écrire à l’avance le scénario de la surprise marocaine et des tirs au but. Surtout Gemini, qui a directement prédit la qualification du Maroc aux tirs au but – une performance vraiment remarquable.

Grok et Qianwen sont plutôt des « spécialistes des scores ». Ils ont prédit plusieurs scores exacts, notamment dans les matchs du Canada, du Brésil, de la Norvège, de la France, etc. Mais le problème est que, face à des équipes traditionnellement fortes comme l’Allemagne ou les Pays-Bas, ils ont finalement penché pour le favori.

ChatGPT et Claude sont plutôt des « spécialistes de l’analyse ». Ils fournissent des raisonnements complets, ne se trompent pas souvent de direction, et peuvent également signaler les risques de prolongations. Mais le problème est qu’ils voient souvent que le match sera difficile, mais n’osent pas conclure en faveur de la surprise. C’est ce qui s’est passé pour Pays-Bas vs Maroc : ils ont vu les risques de prolongations et de tirs au but, mais ont finalement fait confiance aux Pays-Bas.

Donc, plutôt que de se demander quel modèle est le plus calé en football, mieux vaut voir à quels scénarios ils conviennent respectivement.

Lien original

Cliquez pour connaître les postes à pourvoir chez BlockBeats

Bienvenue dans la communauté officielle de BlockBeats :

Groupe Telegram de souscription : https://t.me/theblockbeats

Groupe Telegram de discussion : https://t.me/BlockBeats_App

Compte Twitter officiel : https://twitter.com/BlockBeatsAsia

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé