Memprediksi babak gugur Piala Dunia, seberapa besar perbedaan tingkat AI yang berbeda?

Judul asli: "Memprediksi babak gugur Piala Dunia, seberapa besar perbedaan AI yang berbeda?"
Penulis asli: Asher, Odaily Planet Daily

Setiap pertandingan Piala Dunia, saya meminta AI untuk memprediksi, hampir setiap model berbicara dengan penuh keyakinan dan detail.

Ada yang membahas nilai tim, ada yang menguraikan data babak grup, ada yang menganalisis cedera dan taktik, dan ada yang langsung memberikan skor akhir, perpanjangan waktu, dan skenario adu penalti. Sekilas, ChatGPT, Grok, Qwen, DeepSeek, Gemini, Claude semuanya sangat paham sepak bola.

Tetapi sebagai pengguna pasar prediksi, yang saya pedulikan bukanlah model mana yang berbicara lebih lengkap, tetapi mana yang lebih layak dijadikan referensi.

Seiring Piala Dunia memasuki babak gugur, Odaily Planet Daily sejak pertandingan pertama, sebelum pertandingan menggunakan pertanyaan yang sama sebisa mungkin untuk menanyakan model AI yang berbeda, dan setelah pertandingan membandingkan dengan hasil nyata—model mana yang hanya menganalisis seperti itu, dan mana yang benar-benar menangkap arah pertandingan sebelumnya.

Saat ini, pertandingan babak gugur Piala Dunia yang telah selesai: Kanada 1:0 mengalahkan Afrika Selatan, Brasil 2:1 menang tipis atas Jepang, Jerman tersingkir setelah adu penalti dengan Paraguay, Belanda juga tumbang di bawah adu penalti Maroko. Hingga Belgia vs Senegal, pertandingan berakhir 2:2 setelah perpanjangan waktu, langsung meningkatkan ketidakpastian babak gugur.

DeepSeek dan Gemini, diprediksi akan memenangkan satu pertandingan melawan Maroko

Yang paling berkesan saat ini adalah prediksi DeepSeek dan Gemini untuk pertandingan Belanda vs Maroko. Sebenarnya sebelum pertandingan ini mudah untuk memilih sisi yang salah—Belanda secara teori lebih kuat, susunan pemain lebih lengkap, banyak model tahu Maroko sulit, tetapi pada akhirnya lebih yakin Belanda bisa lolos.

Kehebatan DeepSeek dan Gemini adalah mereka tidak berhenti pada "pertandingan ini akan sangat ketat", tetapi juga menulis skenario selanjutnya. Gemini sebelum pertandingan langsung memberikan skor 1:1 di waktu normal, Maroko menang adu penalti. Hasilnya pertandingan benar-benar berakhir 1:1, dan akhirnya Maroko menang adu penalti 3:2 mengalahkan Belanda. Bukan hanya menebak arah, tetapi juga bagaimana pertandingan akan berakhir adu penalti, siapa yang akan tersenyum pada akhirnya, semuanya hampir tepat.

Prediksi Gemini untuk pertandingan Belanda vs Maroko

DeepSeek juga sangat dekat. Ia menilai waktu normal kemungkinan besar 1:1 atau 0:0, pertandingan mungkin berlanjut ke perpanjangan waktu bahkan adu penalti, dan cenderung Maroko akan lolos dengan kejutan melalui pertahanan dan serangan balik.

Prediksi DeepSeek untuk pertandingan Belanda vs Maroko

Setelah pertandingan ini, keberadaan DeepSeek dan Gemini langsung terangkat. Terutama Gemini, kali ini tidak seperti melakukan prediksi sebelum pertandingan, lebih seperti sudah melihat naskah pertandingan sebelumnya.

Grok dan Qwen secara beruntun menebak skor spesifik, stabilitas lebih kuat dari yang dibayangkan

Selain DeepSeek dan Gemini yang bersinar dalam pertandingan Maroko, Grok dan Qwen juga tidak kalah. Yang paling menonjol adalah dalam pertandingan dengan arah kemenangan yang relatif jelas, mereka tidak hanya menebak tim yang lolos dengan benar, tetapi juga memprediksi skor spesifik yang cukup mendekati hasil akhir.

Afrika Selatan vs Kanada adalah contoh. Sebelum pertandingan, sebagian besar model AI mendukung Kanada, tetapi perbedaannya adalah apakah Kanada akan menang dengan mudah. Grok memberikan prediksi Kanada 1:0, Qwen juga memberikan kemenangan satu gol. Akhirnya Kanada hanya lolos dengan 1 gol, tidak seperti kemenangan besar yang dibayangkan.

Prediksi Qwen untuk pertandingan Afrika Selatan vs Kanada

Brasil vs Jepang juga serupa. Sebagian besar model AI merasa Brasil lebih kuat, tetapi apakah Jepang bisa mengikat pertandingan adalah kuncinya. Grok dan Qwen sama-sama memprediksi skor 2:1, dan akhirnya pertandingan benar-benar berakhir Brasil menang tipis 2:1. Mereka benar bukan hanya "Brasil akan menang", tetapi Jepang bisa memberikan masalah yang cukup bagi Brasil.

Pantai Gading vs Norwegia juga ditebak dengan cukup akurat. Norwegia memiliki Haaland, arah lolos tidak sulit dipahami, tetapi fisik dan serangan sayap Pantai Gading tidak akan membuat pertandingan menjadi satu sisi. Grok dan Qwen sama-sama memprediksi Norwegia menang 2:1, dan skor akhir juga tepat dalam "skenario" ini.

Prediksi Grok untuk pertandingan Pantai Gading vs Norwegia

Kelebihan Grok dan Qwen adalah melihat pertandingan populer lebih detail. Mereka tidak menulis skenario besar seperti Maroko mengalahkan Belanda sebelumnya, tetapi dalam pertandingan Kanada, Brasil, Norwegia, Prancis, arah kemenangan dan skor akhir diberikan cukup dekat. Dengan kata lain, mereka mungkin tidak paling pandai menangkap kejutan, tetapi sangat ahli dalam menilai apakah tim favorit akan menang mudah atau menang tipis dengan susah payah.

ChatGPT tidak memiliki banyak skor spektakuler, tetapi analisis proses pertandingan cukup akurat

ChatGPT tidak seperti Gemini yang memprediksi Maroko menang adu penalti melawan Belanda sebelumnya, juga tidak seperti Grok, Qwen yang secara beruntun menebak beberapa skor spesifik. Namun kelebihannya—banyak pertandingan sebelum pertandingan terlihat tim kuat unggul, ChatGPT akan lebih jelas mengingatkan bahwa pertandingan ini mungkin tidak semudah itu.

Brasil vs Jepang adalah contoh. ChatGPT memprediksi Brasil lolos, tetapi tidak menulis pertandingan Brasil menang mudah, melainkan menyebutkan tekanan, pergerakan, dan disiplin Jepang akan membuat Brasil tidak nyaman, bahkan bisa unggul atau menyamakan kedudukan. Pantai Gading vs Norwegia juga serupa, ChatGPT memprediksi Norwegia lolos, tetapi mengatakan sebelumnya ini bukan pertandingan mudah, fisik, serangan sayap, dan kemampuan transisi Pantai Gading akan menimbulkan masalah.

Prediksi ChatGPT untuk pertandingan Inggris vs Republik Demokratik Kongo

Kelebihan ChatGPT bukan setiap kali menebak skor dengan akurat, tetapi sering bisa mengatakan hambatan pertandingan sebelumnya. Sangat cocok untuk memahami pertandingan, tetapi hanya cocok untuk melihat prediksi skor akhir. Ia bisa mengatakan proses dengan cukup akurat, tetapi saat benar-benar menulis kejutan besar, masih kurang tegas.

Kekalahan Jerman menjadi kegagalan kolektif model AI

Jika beberapa pertandingan sebelumnya masih menunjukkan kelebihan masing-masing model, maka pertandingan Jerman vs Paraguay adalah kegagalan kolektif.

Sebelum pertandingan, semua model AI berpihak pada Jerman. ChatGPT, Grok, Qwen, Gemini, Claude semuanya di sisi Jerman, prediksi skor sebagian besar berkisar 2:0, 3:0, atau 3:1. Alasannya juga konsisten: semua menganggap Jerman secara teori lebih kuat, kedalaman skuad lebih baik, daya serang lebih besar.

Tapi hasilnya justru masalah ini. Model AI meremehkan kemampuan Paraguay menyeret pertandingan ke dalam lumpur, Jerman tidak bisa menyelesaikan pertempuran di waktu normal, juga tidak bisa memecah kebuntuan di perpanjangan waktu, akhirnya terseret ke adu penalti oleh Paraguay dan tersingkir.

Siapa yang paling akurat saat ini?

Dari pertandingan babak gugur yang telah selesai, karakteristik model mulai terlihat.

DeepSeek dan Gemini paling bersinar. Mereka tidak hanya bisa memprediksi tim favorit seperti Brasil, Prancis lolos, tetapi dalam pertandingan kejutan yang lebih sulit, juga memberikan jawaban yang sangat berharga. Pertandingan Belanda vs Maroko, kelebihan utama mereka adalah berani menulis skenario kejutan Maroko dan adu penalti sebelumnya. Terutama Gemini, langsung memprediksi Maroko lolos adu penalti, pertandingan ini memang sangat mencolok.

Grok dan Qwen lebih seperti "pemain skor". Mereka banyak menebak skor spesifik, terutama dalam pertandingan Kanada, Brasil, Norwegia, Prancis. Namun masalahnya saat menghadapi tim tradisional kuat seperti Jerman, Belanda, akhirnya masih condong ke favorit.

ChatGPT dan Claude lebih seperti "pemain analitis". Alasan ditulis lengkap, arah sebagian besar tidak melenceng, juga bisa mengingatkan risiko perpanjangan waktu. Namun masalahnya, mereka sering melihat pertandingan sulit, tetapi kurang berani menulis kesimpulan ke sisi kejutan. Belanda vs Maroko persis seperti ini, sudah melihat risiko perpanjangan waktu dan adu penalti, tetapi akhirnya lebih percaya Belanda.

Jadi, daripada terburu-buru bertanya model mana yang paling paham sepak bola, lebih baik lihat mana yang cocok untuk skenario apa.

Tautan asli

Klik untuk mengetahui posisi lowongan di BlockBeats

Selamat bergabung dengan komunitas resmi BlockBeats:

Grup berlangganan Telegram: https://t.me/theblockbeats

Grup diskusi Telegram: https://t.me/BlockBeats_App

Akun Twitter resmi: https://twitter.com/BlockBeatsAsia

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan