(Businesslounge Journal-News & Insight) Hasil simulasi menunjukkan bahwa Spanyol menjadi favorit juara dengan peluang sebesar 14,5 persen. Kini, ilmu data modern menawarkan pendekatan yang lebih ilmiah. Sebagai bagian dari tim ahli statistik, penulis membantu melatih algoritma pembelajaran mesin (machine learning) untuk memprediksi jalannya turnamen dan menentukan tim yang memiliki peluang terbesar menjadi juara.
Prediksi Probabilistik dan Dadu yang Dimodifikasi
Algoritma yang dikembangkan bekerja dalam dua tahap.
Tahap pertama menggabungkan model statistik canggih dengan penilaian para bandar taruhan internasional serta data pasar transfer pemain untuk mengukur kekuatan masing-masing tim dan pemainnya. Pada tahap kedua, algoritma machine learning menentukan cara terbaik untuk mengombinasikan estimasi kekuatan tersebut dengan berbagai informasi tambahan mengenai setiap tim.
Hasilnya adalah prediksi probabilistik untuk setiap pertandingan di turnamen. Sistem ini dapat diibaratkan seperti sepasang dadu yang telah dimodifikasi. Jika dadu biasa memiliki angka 1 hingga 6 dengan peluang yang sama, maka dadu dalam model ini memiliki peluang berbeda untuk menghasilkan jumlah gol bagi masing-masing tim.
Sebagai contoh, model memperkirakan Meksiko akan mencetak rata-rata 1,9 gol pada laga pembuka, sedangkan lawannya, Afrika Selatan, hanya sekitar 0,7 gol. Namun, hal itu tidak berarti Meksiko pasti menang. Berdasarkan simulasi, peluang kemenangan Meksiko mencapai 65 persen, hasil imbang 21 persen, dan kemenangan Afrika Selatan 14 persen.
Simulasi 100.000 Kali
Dengan menggunakan pasangan “dadu” berbeda untuk setiap pertandingan, seluruh rangkaian laga Piala Dunia dapat disimulasikan. Tim peneliti memperhitungkan hasil undian resmi turnamen serta seluruh aturan FIFA, termasuk kemungkinan perpanjangan waktu dan adu penalti.
Simulasi dilakukan sebanyak 100.000 kali untuk memperoleh gambaran paling mungkin mengenai jalannya turnamen.
Hasilnya menempatkan Spanyol sebagai favorit utama dengan peluang juara 14,5 persen. Di belakangnya terdapat Inggris dan Prancis yang masing-masing memiliki peluang 12,4 persen, disusul Jerman dengan 11,2 persen.
Format baru Piala Dunia yang melibatkan 48 tim dan lima babak gugur membuat persaingan antarkandidat juara menjadi sangat ketat. Selain empat tim teratas, Portugal dan Argentina juga dinilai memiliki peluang besar, masing-masing sebesar 8,9 persen dan 8,2 persen.
Sementara itu, Amerika Serikat memiliki peluang 78 persen untuk lolos ke babak 32 besar, tertinggi di grupnya. Namun, peluang mereka terus menurun pada fase gugur karena setiap pertandingan bersifat hidup-mati. Peluang tim tuan rumah menjadi juara di final yang digelar di MetLife Stadium, New Jersey, pada 19 Juli hanya sekitar 1 persen.
Mesin Prediksi di Balik Simulasi
Algoritma dan simulasi tersebut didukung oleh kombinasi data, pengetahuan para ahli, serta model statistik.
Pertama, seluruh pertandingan tim nasional dalam delapan tahun terakhir digunakan untuk menghasilkan estimasi kekuatan historis masing-masing negara.
Kedua, dibuat estimasi prospektif berdasarkan peluang taruhan dari berbagai bandar internasional yang mencerminkan pandangan para ahli terhadap turnamen mendatang.
Ketiga, penilaian terhadap pemain dilakukan berdasarkan kontribusi mereka terhadap gol di level klub maupun tim nasional.
Keempat, kualitas saat ini dan potensi masa depan pemain diukur melalui nilai pasar yang diperkirakan oleh situs Transfermarkt, yang menggunakan pendekatan penilaian berbasis komunitas untuk memperkirakan nilai pasar aktual pemain.
Keempat variabel tersebut kemudian dipadukan dengan berbagai faktor lain yang relevan, termasuk peringkat FIFA, jumlah pemain dari suatu negara yang tampil di semifinal Liga Champions musim ini, hingga indikator sosial-ekonomi seperti produk domestik bruto (PDB) per kapita.
Menggunakan Hutan Acak
Untuk mengetahui faktor mana yang paling berpengaruh terhadap hasil pertandingan, tim peneliti menggunakan metode machine learning yang dikenal sebagai random forest atau “hutan acak”.
Metode ini terdiri atas banyak pohon keputusan (decision trees) yang masing-masing menganalisis kombinasi data berbeda. Algoritma tersebut dilatih menggunakan seluruh pertandingan pada turnamen sepak bola besar sejak Piala Dunia 2006.
Dengan cara itu, sistem dapat menghubungkan kekuatan tim, nilai pasar pemain, dan berbagai faktor lainnya dengan jumlah gol yang kemungkinan tercipta dalam pertandingan Piala Dunia.
Rekam Jejak Prediksi
Ini bukan pertama kalinya tim peneliti yang terdiri dari Andreas Groll, Rouven Michels, Lars Magnus Hvattum, Gunther Schauberger, dan rekan-rekannya membuat prediksi Piala Dunia.
Pada Piala Dunia Wanita 2019, mereka berhasil memprediksi Amerika Serikat sebagai juara. Namun pada Piala Dunia Wanita 2023 dan Piala Dunia Pria 2022, pemenangnya—Spanyol dan Argentina—bukanlah favorit utama dalam model mereka, meskipun keduanya diperkirakan sebagai kandidat kuat.
Kesimpulannya, prediksi selalu berbicara tentang peluang, bukan kepastian. Program komputer ini memang tidak dapat menentukan juara dengan akurasi 100 persen, tetapi kemungkinan besar mampu memberikan prediksi yang lebih baik dibandingkan seekor gurita peramal.

