Прогнозирование матчей плей-офф чемпионата мира по футболу — насколько велика разница в уровне разных ИИ?

robot
Генерация тезисов в процессе

Оригинал | Odaily Planet Daily (@OdailyChina)

Автор | Asher (@Asher 0210)_

Перед каждым матчем чемпионата мира я просил ИИ сделать прогнозы. Почти каждая модель объясняла всё убедительно и подробно.

Одни говорили о стоимости команд, другие разбирали данные группового этапа, третьи анализировали травмы и тактику, а некоторые прямо давали сценарии счёта, дополнительного времени и пенальти. На первый взгляд, ChatGPT, Grok, Qwen, DeepSeek, Gemini, Claude — все хорошо разбираются в футболе.

Но как пользователь рынка прогнозов, мне на самом деле важно не то, какая модель говорит более полно, а какая заслуживает большего доверия.

С выходом чемпионата мира в стадию плей-офф Odaily Planet Daily, начиная с первого матча, перед игрой задавала разным AI-моделям максимально одинаковые вопросы, а после матча сверяла с реальными результатами — какие модели только делали вид, что анализируют, а какие действительно заранее улавливали ход игры.

На данный момент в завершившихся матчах плей-офф чемпионата мира: Канада 1:0 обыграла ЮАР, Бразилия 2:1 с трудом одолела Японию, Германия после серии пенальти с Парагваем выбыла, Голландия также пала под ударами Марокко по пенальти. А матч Бельгии против Сенегала закончился со счётом 2:2, затем последовал камбэк в овертайме, что сделало неопределённость плей-офф максимальной.

DeepSeek и Gemini, предсказавшие матч с Марокко, — настоящие герои

Самый запоминающийся момент — прогнозы DeepSeek и Gemini на матч Голландия против Марокко. Перед этой игрой легко было ошибиться с выбором: у Голландии сильнее команда на бумаге и более полный состав. Многие модели знали, что Марокко будет непросто, но всё же верили, что Голландия пройдёт дальше.

Сильная сторона DeepSeek и Gemini в том, что они не остановились на стадии «матч будет напряжённым», а написали и дальнейший сценарий. Gemini прямо перед матчем дал счёт 1:1 в основное время и победу Марокко по пенальти. В итоге матч действительно закончился 1:1, а Марокко выбило Голландию по пенальти 3:2. Не просто угадали направление, а и то, как игра дойдёт до пенальти и кто в итоге победит — всё практически совпало.

Прогноз Gemini на матч Голландия против Марокко

DeepSeek тоже был близок. Он оценил, что основное время, скорее всего, закончится 1:1 или 0:0, матч может затянуться до овертайма и даже пенальти, и склонился к тому, что Марокко за счёт защиты и контратак сделает сенсацию и пройдёт.

Прогноз Deepseek на матч Голландия против Марокко

После этого матча присутствие DeepSeek и Gemini резко возросло. Особенно Gemini — на этот раз он не столько делал прогноз перед игрой, сколько словно заранее прочитал сценарий матча.

Grok и Qwen дали точные счёты подряд, стабильность оказалась выше ожидаемой

Помимо того, что DeepSeek и Gemini блеснули в матче с Марокко, Grok и Qwen тоже не остались незамеченными. Их самый яркий момент — в некоторых матчах, где исход был относительно ясен, они не только правильно определили прошедшую команду, но и дали счёт, близкий к итоговому результату.

Пример — матч ЮАР против Канады. Перед игрой большинство AI-моделей считали фаворитом Канаду, но разногласия были в том, легко ли Канада выиграет. Grok дал прогноз 1:0 в пользу Канады, а Qwen тоже предположил победу с минимальным счётом. В итоге Канада действительно прошла благодаря одному голу, без ожидаемой крупной победы.

Прогноз Qwen на матч ЮАР против Канады

Аналогичная ситуация с матчем Бразилия — Япония. Большинство AI-моделей считали Бразилию сильнее, но ключевым было то, сможет ли Япония навязать борьбу. Grok и Qwen предсказали счёт 2:1, и матч действительно закончился 2:1 в пользу Бразилии. Они правильно оценили не просто «Бразилия победит», а то, что Япония сможет создать Бразилии достаточно проблем.

В матче Кот-д’Ивуар — Норвегия оба тоже оказались точны. У Норвегии есть Холанн, направление прохода легко понять, но физическая борьба и фланговые атаки Кот-д’Ивуара не дадут игре стать односторонней. Grok и Qwen предсказали победу Норвегии 2:1, и итоговый счёт точно совпал с этим «сценарием».

Прогноз Grok на матч Кот-д’Ивуар — Норвегия

Сильная сторона Grok и Qwen — более детальный анализ популярных матчей. Они не написали заранее крупный сценарий с Марокко, выбивающим Голландию, но в матчах с Канадой, Бразилией, Норвегией, Францией направление победы и счёт были даны довольно близко. Иными словами, они не обязательно лучше всех выявляют сенсации, но хорошо определят, будет ли фаворит доминировать или победит с трудом.

У ChatGPT не слишком точные счета, но анализ хода матча довольно верен

ChatGPT не дал такого прогноза, как Gemini, с предсказанием пенальти Марокко против Голландии, и не попадал в точные счета подряд, как Grok или Qwen. Но его преимущество — во многих матчах, которые выглядят как доминирование фаворита, ChatGPT более очевидно предупреждает, что игра может быть не такой лёгкой.

Пример — матч Бразилия — Япония. ChatGPT предсказал проход Бразилии, но не описал игру как лёгкое доминирование, а упомянул, что прессинг, беготня и дисциплина Японии заставят Бразилию чувствовать дискомфорт, и Япония даже может забить первой или сравнять счёт. В матче Кот-д’Ивуар — Норвегия ChatGPT также предсказал проход Норвегии, но заранее сказал, что это не будет лёгкая игра, и физическая борьба, фланговые атаки и контратаки Кот-д’Ивуара создадут проблемы.

Кроме того, в матче плей-офф Англия — Демократическая Республика Конго ChatGPT не написал просто «Англия выиграет крупно», а посчитал, что игра может быть скучной, и ДР Конго с низкой защитой затянет темп. В итоге Англия прошла, но победа далась нелегко.

Прогноз ChatGPT на матч Англия — Демократическая Республика Конго

Сильная сторона ChatGPT не в том, что каждый раз точно предсказывает счёт, а в том, что часто заранее указывает, где возникнут трудности в игре. Он хорошо подходит для понимания матча, но не столько для итогового точного счёта. Он может довольно верно описать ход игры, но когда дело доходит до крупных сенсаций, ему не хватает решительности.

Выход Германии стал коллективным провалом AI-моделей

Если предыдущие матчи ещё показывали сильные стороны разных моделей, то матч Германия — Парагвай стал коллективным провалом.

Перед игрой все AI-модели были на стороне Германии. ChatGPT, Grok, Qwen, Gemini, Claude — все поддерживали Германию, прогнозы счёта в основном 2:0, 3:0 или 3:1. Аргументы были одинаковы: считали, что у Германии сильнее состав на бумаге, глубже скамейка, больше атакующей мощи.

Но именно в этом матче возникла проблема. AI-модели недооценили способность Парагвая затянуть игру в болото: Германия не решила исход в основное время, не смогла сломать ничью в овертайме и в итоге проиграла Парагваю по пенальти, вылетев.

Кто самый точный на данный момент?

Судя по завершившимся матчам плей-офф, особенности разных моделей начинают проявляться.

DeepSeek и Gemini — самые яркие. Они не только могут предсказать проход фаворитов вроде Бразилии, Франции, но и в более сложных сенсационных матчах дали очень ценные ответы. В матче Голландия — Марокко их ключевое преимущество — смелость заранее написать сценарий сенсации Марокко и серии пенальти. Особенно Gemini, который прямо предсказал проход Марокко по пенальти — этот матч действительно запоминается.

Grok и Qwen больше похожи на «игроков по счёту». Они дали немало точных счётов, особенно хорошо показали себя в матчах с Канадой, Бразилией, Норвегией, Францией. Но проблема в том, что, сталкиваясь с традиционными грандами, такими как Германия и Голландия, они в итоге склонялись к фаворитам.

ChatGPT и Claude больше похожи на «аналитиков». Их аргументы полны, направление в большинстве случаев не ошибочно, они могут предупредить о рисках овертайма. Но проблема в том, что они часто видят, что игра будет трудной, но не решаются делать вывод в сторону сенсации. В матче Голландия — Марокко это было именно так: хотя уже видели риск овертайма и пенальти, всё равно верили в Голландию.

Так что вместо того, чтобы спешить спрашивать, какая модель лучше всех разбирается в футболе, лучше посмотреть, для каких сценариев каждая из них подходит.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено