AI memprediksi "32 Besar Piala Dunia" dengan akurasi melebihi manusia

Babak grup Piala Dunia 2026 yang diadakan di Amerika Serikat, Kanada, dan Meksiko telah berakhir, dan daftar lengkap 32 besar resmi diumumkan. Di lapangan hijau, tim-tim kuat tradisional dan tim kuda hitam bersaing sengit, sementara di luar lapangan, sebuah "pertempuran manusia vs mesin prediksi" yang dipimpin oleh kecerdasan buatan juga mencapai "penyelesaian" tahapannya.

Dalam "Pertempuran Prediksi Piala Dunia Manusia vs Mesin" yang digagas oleh Lenovo Group bersama Migu Video, 12 model AI besar domestik utama dan pakar manusia masing-masing memprediksi hasil dari 104 pertandingan. Data akhir menunjukkan bahwa tingkat akurasi prediksi keseluruhan dari kubu AI melampaui pakar manusia, dan beberapa model AI bahkan berhasil memprediksi tim kuda hitam seperti Tanjung Verde yang tidak memiliki data historis Piala Dunia, menghasilkan beberapa hasil "anti-konsensus".

Sumber gambar: Foto dari resmi Lenovo

Dari 28 Mei hingga sebelum Piala Dunia dimulai, Lenovo Tianxi AI sebagai "penyelenggara utama" mengirimkan lembar jawaban "Ujian Seragam Tebak 32 Besar Piala Dunia 2026" kepada 12 model AI besar domestik utama dan pakar manusia, meminta mereka untuk menyerahkan "jawaban" mereka sebelum pertandingan.

Pada tanggal 28 Juni waktu Beijing, seiring pertandingan penutup Grup J antara Aljazair dan Austria berakhir imbang 3:3, peringkat prediksi masing-masing AI pun terungkap. Di antaranya, Tencent Hunyuan menempati peringkat teratas dengan menebak 29 tim yang lolos, diikuti oleh MiniMax dan iFlytek Spark masing-masing dengan 28 tebakan. Tingkat kemenangan keseluruhan kubu AI mencapai 61,9%, unggul 7,3% dari pakar manusia.

Yang lebih menarik, dalam prediksi pra-pertandingan, empat dari 12 AI dengan berani mendukung "pendatang baru" Tanjung Verde. Prediksi "anti-konsensus" ini terbukti satu per satu oleh hasil pertandingan Tanjung Verde - tim tersebut berhasil menahan imbang tim-tim kuat tradisional seperti Spanyol dan Uruguay, lolos dengan rekor tak terkalahkan.

Ma Lin, Direktur Teknis SenseTime, menjelaskan kepada reporter Time Finance bahwa alasan mengapa model AI besar dapat memprediksi Tanjung Verde sebagai "kuda hitam terbesar" adalah karena model tersebut mampu menembus penampilan kekuatan di atas kertas dan menggali data yang mendalam. Meskipun Tanjung Verde adalah "pendatang baru" Piala Dunia, pemainnya sebagian besar tumbuh di bawah sistem liga Eropa, dan dalam beberapa tahun terakhir, performa kualifikasi mereka kuat. Model AI dengan menangkap variabel data mendalam seperti disiplin pertahanan sepak bola, efisiensi serangan balik, dan struktur pemain, menghasilkan kesimpulan yang lebih rasional daripada pengalaman manusia.

Namun, AI juga menunjukkan keterbatasan dalam ketidakpastian ekstrem saat menunjukkan kemampuan "anti-konsensus". Ambil contoh pertandingan Tanjung Verde melawan Arab Saudi, hasil penilaian 12 AI terbagi menjadi tiga jenis: DeepSeek, Kimi, Jieyue, iFlytek Spark memprediksi kemenangan Arab Saudi; Tongyi Qianwen, Zhongyi Jiutian, Tianxi AI, Tencent Hunyuan, SenseTime Xiaohuanxiong memprediksi hasil imbang; Baidu Wenxin, Zhipu, MiniMax memprediksi kemenangan Tanjung Verde. Meskipun hasil akhirnya imbang, tidak ada satu model pun yang secara tepat menebak skor akhir 0:0.

Fenomena ini mengungkapkan titik buta umum dalam prediksi AI saat ini, yaitu "melebih-lebihkan daya serang". Meskipun 5 model memprediksi hasil imbang, skor yang mereka berikan semuanya mengandung setidaknya satu gol. Menurut data resmi Lenovo, di antara 9 hasil imbang yang terjadi di babak grup, tingkat akurasi prediksi AI kurang dari 3%. Dari sini, model AI besar lebih mahir dalam menangani data terstruktur dan tren deterministik, tetapi untuk olahraga tim seperti sepak bola yang melibatkan faktor psikologis di tempat, cedera mendadak, dan kebetulan ganda, masih ada bagian yang tidak dapat diperkirakan oleh model AI besar.

Piala Dunia edisi ini dipenuhi dengan kuda hitam, membuat prediksi AI menjadi beragam. Ini sebenarnya mengungkapkan kelemahan dari model besar, yaitu "kesamaan logika dasar". Karena model besar pada dasarnya adalah "pemampat probabilitas" yang melakukan inferensi berdasarkan data historis. Dalam pertandingan rutin di mana kekuatan tim jelas berbeda, mereka menggunakan data yang sama dan secara alami sampai pada kesimpulan yang sama; tetapi begitu mereka menghadapi tim yang belum pernah dilihat sebelumnya, atau ketika taktik inovatif atau gaya ekstrem muncul dalam pertandingan, AI akan "gagal secara kolektif" karena kurangnya acuan historis. Karena mereka tidak benar-benar memahami pertandingan, hanya menebak berdasarkan probabilitas saat menghadapi hal yang tidak diketahui.

Faktanya, "pertempuran manusia vs mesin" dalam memprediksi hasil Piala Dunia bukanlah pertunjukan tunggal Lenovo; banyak perusahaan model besar terkemuka juga telah berpartisipasi: Qianwen meluncurkan asisten AI prediksi sepak bola khusus, yang tidak hanya mencakup seluruh 104 pertandingan untuk pengguna bersaing dengan AI, tetapi juga meluncurkan "Program Lapangan" - ketika poin tebakan pengguna mencapai jumlah tertentu, Qianwen akan menyumbangkan pembangunan lapangan sepak bola untuk sekolah pedesaan.

Moonshot AI (Kimi) juga membangun 300 Agen khusus, masing-masing bertanggung jawab atas analisis taktik, pelacakan kondisi pemain, perhitungan jadwal, dan pemantauan odds, dan akhirnya menghasilkan laporan prediksi mendalam setebal 224 halaman, menunjukkan kemampuan multi-agen untuk menangani tugas kompleks secara kolaboratif. Selain itu, model Claude Fable 5 dari Anthropic juga memberikan prediksi berdasarkan variabel makro seperti struktur turnamen (48 tim berpartisipasi, juara harus bermain 8 pertandingan), suhu tinggi musim panas di Amerika Utara, dan kurva usia skuad tim.

Cara partisipasi yang beragam ini tidak hanya membuat prediksi AI berkembang dari sekadar "tebak menang/kalah" menjadi demonstrasi teknis komprehensif yang mencakup analisis data, kolaborasi multi-agen, interaksi amal, dan penalaran makro, tetapi juga menjadikan "pertempuran manusia vs mesin" seputar Piala Dunia ini sebagai tempat uji coba yang sempurna bagi berbagai perusahaan untuk menguji kemampuan penerapan model besar. Namun dari dimensi yang lebih tinggi, dalam sistem kompleks seperti pengambilan keputusan bisnis, penelitian makroekonomi, dan bahkan tata kelola sosial, AI juga menghadapi permainan antara "kelengkapan data" dan "kekacauan realitas".

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

3 Suka

Hadiah
3
4
Posting ulang
Bagikan

Komentar

Tambahkan komentar

ThisIsTranslateContent:

· 46menit yang lalu

Teguh HODL💎

Lihat AsliBalas0

ThisIsTranslateContent:

· 46menit yang lalu

Gas aja 👊

Lihat AsliBalas0

Yunna

· 1jam yang lalu

Ayo 🔥

Lihat AsliBalas0

HighAmbition

· 1jam yang lalu

Terima kasih atas pembaruannya.

Lihat AsliBalas0

Topik Trending
Lihat Lebih Banyak
#
TradFiCFDGoldMaster
2,21M Popularitas
#
SaylorHintsAtMoreBTC
8,52M Popularitas
#
IsraelStrikesIranBTCPlunges
66,45K Popularitas
#
PredictWorldCupShare20000U
537,46K Popularitas
#
SolanaEcosystemANSEMSurges
22,02M Popularitas

Disematkan

peta situs

‍#广场预测世界杯赢40000U

Topik Trending

TradFiCFDGoldMaster

SaylorHintsAtMoreBTC

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Disematkan