¿Predecir las eliminatorias del Mundial, los diferentes niveles de IA son tan diferentes?

robot
Generación de resúmenes en curso

Original | Odaily Planet Daily (@OdailyChina)

Autor | Asher (@Asher 0210)_

Antes de cada partido del Mundial, le pido a la IA que haga predicciones, y casi todos los modelos hablan con mucha autoridad y llenos de detalles.

Unos hablan del valor del equipo, otros desglosan los datos de la fase de grupos, algunos analizan lesiones y tácticas, y otros directamente dan el marcador, la prórroga y el guion de los penaltis. A simple vista, ChatGPT, Grok, Qwen, DeepSeek, Gemini y Claude parecen entender mucho de fútbol.

Pero como usuario del mercado de predicciones, lo que realmente me importa no es qué modelo habla de manera más completa, sino cuál es más fiable para tomar como referencia.

A medida que el Mundial avanza a la fase de eliminatorias, Odaily Planet Daily, desde el primer partido, preguntó a diferentes modelos de IA con las mismas preguntas antes del partido, y después del partido comparó los resultados reales para ver qué modelos solo analizan de manera convincente y cuáles realmente captaron la dirección del juego antes.

Hasta ahora, en las eliminatorias del Mundial ya disputadas, Canadá ganó 1:0 a Sudáfrica, Brasil venció 2:1 a Japón, Alemania fue eliminada tras ser llevada a penaltis por Paraguay, y Países Bajos también cayó en los penaltis contra Marruecos. En el partido de Bélgica contra Senegal, el partido terminó 2:2 y se remontó en la prórroga, llevando la incertidumbre de las eliminatorias al máximo.

DeepSeek y Gemini, se coronan con la predicción del partido de Marruecos

Actualmente, lo más memorable es la predicción de DeepSeek y Gemini sobre Países Bajos vs Marruecos. Antes de este partido, era fácil apostar por el lado equivocado: Países Bajos tenía más calidad sobre el papel y una plantilla más completa. Muchos modelos sabían que Marruecos no sería fácil, pero al final confiaban en que Países Bajos pasaría.

Lo impresionante de DeepSeek y Gemini es que no se quedaron en "este partido será muy reñido", sino que también escribieron el guion posterior. Gemini dio directamente un 1:1 en el tiempo reglamentario y una victoria de Marruecos en los penaltis. El partido realmente terminó 1:1 y Marruecos eliminó a Países Bajos por 3:2 en los penaltis. No solo acertaron la dirección, sino que también coincidieron en cómo el partido se llevaría a los penaltis y quién se reiría al final.

Predicción de Gemini sobre el partido Países Bajos vs Marruecos

DeepSeek también estuvo muy cerca. Consideró que el tiempo reglamentario probablemente sería 1:1 o 0:0, y que el partido podría alargarse hasta la prórroga e incluso los penaltis, inclinándose por una sorpresa de Marruecos gracias a su defensa y contraataques.

Predicción de DeepSeek sobre el partido Países Bajos vs Marruecos

Después de este partido, la presencia de DeepSeek y Gemini se disparó. Especialmente Gemini, que esta vez no parecía estar haciendo una predicción previa, sino que parecía haber visto el guion del partido de antemano.

Grok y Qwen aciertan consecutivamente marcadores específicos, su estabilidad es mayor de lo esperado

Además de los momentos destacados de DeepSeek y Gemini en el partido de Marruecos, Grok y Qwen no se quedaron atrás. Su punto más brillante es que, en algunos partidos donde la dirección del resultado era relativamente clara, no solo acertaron qué equipo avanzaría, sino que también predijeron marcadores específicos bastante cercanos al resultado final.

El partido de Sudáfrica contra Canadá es un ejemplo. Antes del partido, la mayoría de los modelos de IA favorecían a Canadá, pero la discrepancia estaba en si Canadá ganaría fácilmente. Grok predijo un 1:0 para Canadá, y Qwen también dio una victoria por un gol de diferencia. Al final, Canadá solo necesitó un gol para pasar, sin lograr la gran victoria que se esperaba.

Predicción de Qwen sobre el partido Sudáfrica vs Canadá

El partido de Brasil contra Japón fue similar. La mayoría de los modelos de IA pensaban que Brasil era más fuerte, pero la clave era si Japón podría mantener el partido reñido. Tanto Grok como Qwen predijeron un marcador de 2:1, y el partido realmente terminó con Brasil ganando 2:1. No acertaron simplemente "Brasil ganará", sino que Japón causaría suficientes problemas a Brasil.

En el partido de Costa de Marfil contra Noruega, ambos también acertaron bastante. Noruega tiene a Haaland, la dirección de avance no era difícil de entender, pero la fuerza física de Costa de Marfil y su ataque por las bandas no harían que el partido fuera un monólogo. Grok y Qwen predijeron una victoria de Noruega por 2:1, y el marcador final coincidió con ese "guion".

Predicción de Grok sobre el partido Costa de Marfil vs Noruega

La ventaja de Grok y Qwen es que analizan con más detalle los partidos favoritos. No escribieron el gran guion de Marruecos eliminando a Países Bajos, pero en partidos como Canadá, Brasil, Noruega y Francia, tanto la dirección del resultado como el marcador fueron bastante acertados. En otras palabras, no son los mejores detectando sorpresas, pero son muy buenos determinando si un equipo favorito arrasará o apenas ganará por la mínima.

ChatGPT no tiene muchos marcadores sorprendentes, pero su análisis del desarrollo del partido es bastante preciso

ChatGPT no predijo la eliminación de Países Bajos por penaltis contra Marruecos como Gemini, ni acertó varios marcadores específicos consecutivos como Grok y Qwen. Pero su fortaleza es que, en muchos partidos que parecen dominados por el favorito, ChatGPT advierte más claramente que el partido no será tan fácil.

El partido de Brasil contra Japón es un ejemplo. ChatGPT predijo que Brasil avanzaría, pero no describió el partido como un paseo para Brasil, sino que mencionó que la presión, el movimiento y la disciplina de Japón incomodarían a Brasil, e incluso podrían adelantarse o empatar. En el partido de Costa de Marfil contra Noruega, ChatGPT predijo que Noruega avanzaría, pero advirtió que no sería un partido fácil, ya que la fuerza física, el ataque por bandas y la capacidad de transición de Costa de Marfil causarían problemas.

Además, en el partido de eliminatorias de Inglaterra contra la República Democrática del Congo, ChatGPT no se limitó a predecir una gran victoria inglesa, sino que consideró que el partido podría ser aburrido, ya que la República Democrática del Congo usaría una defensa baja para frenar el ritmo. Al final, Inglaterra avanzó, pero no sin esfuerzo.

Predicción de ChatGPT sobre el partido Inglaterra vs República Democrática del Congo

La fortaleza de ChatGPT no es acertar siempre el marcador, sino anticipar con frecuencia las dificultades del partido. Es muy adecuado para entender el desarrollo del juego, pero no tanto para obtener un marcador final. Puede describir bien el proceso, pero cuando se trata de predecir una gran sorpresa, le falta un poco de determinación.

La eliminación de Alemania, un fracaso colectivo de los modelos de IA

Si antes se podían ver los puntos fuertes de cada modelo, el partido de Alemania contra Paraguay fue un fracaso colectivo.

Antes del partido, todos los modelos de IA se pusieron del lado de Alemania. ChatGPT, Grok, Qwen, Gemini, Claude, todos apoyaban a Alemania, con predicciones de marcador que iban desde 2:0, 3:0 hasta 3:1. La razón era unánime: consideraban que Alemania tenía más calidad sobre el papel, mejor profundidad de plantilla y mayor potencia ofensiva.

Pero el resultado fue diferente. Los modelos de IA subestimaron la capacidad de Paraguay para llevar el partido a un terreno fangoso. Alemania no pudo resolver el partido en el tiempo reglamentario, ni romper el empate en la prórroga, y finalmente fue eliminada tras perder en los penaltis.

¿Quién es el más preciso hasta ahora?

A la vista de las eliminatorias ya disputadas, las características de los diferentes modelos comienzan a mostrarse.

DeepSeek y Gemini son los más destacados. No solo pueden predecir que equipos favoritos como Brasil y Francia avanzarán, sino que también en partidos más difíciles de pronosticar, dieron respuestas de gran valor. En el partido de Países Bajos contra Marruecos, su ventaja clave fue atreverse a escribir el guion de la sorpresa de Marruecos y los penaltis. Especialmente Gemini, que predijo directamente la victoria de Marruecos en los penaltis, fue realmente impresionante.

Grok y Qwen son más "jugadores de marcadores". Acertaron varios marcadores específicos, especialmente en partidos como Canadá, Brasil, Noruega y Francia. Pero el problema es que, ante equipos tradicionalmente fuertes como Alemania y Países Bajos, terminaron inclinándose por el favorito.

ChatGPT y Claude son más "jugadores de análisis". Escriben razonamientos completos, la dirección no suele ser descabellada y pueden advertir sobre riesgos de prórroga. Pero el problema es que a menudo ven que el partido será difícil, pero no se atreven a llevar la conclusión hacia la sorpresa. En el caso de Países Bajos contra Marruecos, aunque ya veían el riesgo de prórroga y penaltis, finalmente confiaron más en Países Bajos.

Por lo tanto, en lugar de preguntar rápidamente qué modelo entiende más de fútbol, es mejor ver para qué escenarios es adecuado cada uno.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado