Quién ganará el Mundial de Rusia, según el aprendizaje automático

Adrian Raya hace 2 meses

Investigadores han desarrollado un sistema para averiguar quién ganará el Mundial de Rusia usando aprendizaje automático.

Ya queda menos para el arranque de la Copa del Mundo 2018, y las apuestas están al rojo vivo; ¿quién levantará el preciado trofeo el próximo 15 de julio? En esta edición parece haber dos candidatos favoritos, los sospechosos habituales Brasil, además de la vigente campeona, Alemania.

Las casas de apuestas apuestan por esas dos selecciones, aunque España, Francia y Argentina también son candidatas. Las estadísticas y el simple conocimiento del fútbol actual son suficientes para llegar a esas afirmaciones.

Pero, ¿y si analizásemos esta pregunta desde un punto de vista más técnico? Los investigadores de la Universidad de Dortmund decidieron hacer eso mismo, desarrollando técnicas de aprendizaje automático que pueden ser más precisas que simples análisis estadísticos.

La técnica de “bosques aleatorios” que puede predecir el mundial

Para conseguirlo, han usado una combinación de aprendizaje automático con estadísticas convencionales, con una técnica conocida como “bosques aleatorios” (random-forest); ha cobrado fuerza en los últimos años, como un método para determinar eventos futuros usando un árbol de decisiones, en los que cada resultado se calcula en una “rama” en base al conjunto de datos usados para entrenar al sistema.

Los investigadores usaron ese método para crear un modelo de la Copa del Mundo 2018, determinando los partidos que cada equipo iba a jugar (o los que eran más probables que iban a jugar), y en base a eso, crear un resultado medio, el que es más probable que se de.

Qué datos definen a una selección nacional.

Para crear este modelo, los investigadores usaron una variedad de datos y factores que podrían determinar el resultado final. Y no hablamos sólo de aspectos puramente deportivos, sino que también tuvieron en cuenta factores económicos, como el producto interior bruto.

Por supuesto, se tuvo en cuenta la clasificación mundial de la FIFA de los equipos nacionales, la edad media de los jugadores, la cantidad de jugadores que participaron en la Champions League, si tienen ventaja de campo (es decir, si son los anfitriones), y muchos más.

No todos los datos tienen el mismo peso; en la investigación se descubrió que la clasificación de la FIFA tenía mucho peso, pero que la nacionalidad del entrenador no era tan importante.

Investigan quién ganará el Mundial de Rusia usando aprendizaje automático

Y ahora la respuesta que estábamos esperando: ¿quién ganará?

Usando el modelo de bosque aleatorio, la predicción es que la selección de España ganará el Mundial, con una probabilidad del 17,8%.

Sin embargo, no todo es tan simple. La predicción depende mucho de la estructura del campeonato; aunque ya sabemos los grupos iniciales, no sabemos qué equipos llegarán a las eliminatorias; y eso puede beneficiar mucho a España, pero de camino puede encontrarse a un rival importante.

La clave está en Alemania, y en cómo pasará la fase de grupos (si la pasa, que todo el mundo espera que lo hará, claro). Si lo consigue, es más probable que se encuentre fuertes rivales en los octavos de final.

Es por eso que las probabilidades de que Alemania llegue a cuartos son de “sólo” el 58%; en cambio, es poco probable que España se encuentre con grandes rivales, y tiene un 73% de posibilidades de llegar a cuartos.

Es por eso que España tiene más posibilidades de ganar el Mundial, porque es más probable que Alemania no pueda llegar a cuartos de final. Sin embargo, esta no es la respuesta final que han dado los investigadores.

Cuál es el campeonato más probable, y quién lo ganaría

Puede a los científicos les pudiese el orgullo patrio (Dortmund está en Alemania), pero volvieron a usar el método de bosque aleatorio buscando más respuestas, esta vez simulando todo el campeonato unas 100.000 ocasiones y buscando la versión más probable.

Y descubrieron que, en el campeonato más probable, Alemania ganaría el Mundial. Para que esto ocurra, España arrollaría a Rusia en octavos y ganaría a Argentina en cuartos; Alemania se enfrentaría a Suiza en octavos y a Inglaterra en cuartos. Ambos equipos se encontrarían en semifinales, y en esa situación la simulación da un 55% de probabilidades de una victoria de Alemania.

Una vez en la final, prevé que sería más fácil ganar a Brasil, para llevarse la Copa del Mundo. Sin embargo, esta es una simulación entre 100.000; aunque sea la más probable, cualquier mínima diferencia podría decantar la balanza a los españoles.

En resumidas cuentas. España es la favorita para ganar el Mundial 2018 según el aprendizaje automático; pero si Alemania llega a cuartos, la historia podría cambiar. Claro, que este estudio fue publicado antes de que se supiese que España ha perdido a su seleccionador, Julen Lopetegui, a apenas 48 horas del Mundial; tal vez si hubieran tenido ese dato, el resultado de la simulación sería diferente.