En Silicio

Explorando la realidad usando datos y gráficas

1650 personas se han suscrito

Otros reciben En Silicio por correo

Estimando la probabilidad de que el Real Madrid gane la liga

April 17, 2009 por Kiko Llaneras · 16 Comentarios

El fútbol es un deporte de tradición anumérica, pero no tiene porque ser así. Pensad en los números de esta liga: el Real Madrid está a seis puntos de un excelente Barcelona, quedan ocho jornadas y una de ellas enfrentará a ambos equipos.

Cualquier aficionado sabe que el Madrid lo tiene difícil, pero, ¿cuánto de difícil? ¿tiene un 5% de probabilidades o un 35%?

Para estimar las probabilidades que tiene el Madrid de ganar la liga he simulado varios millones de “ligas posibles” en diferentes escenarios, usando una especie de metodo de Monte Carlo.

Voy a describir los resultados primero, los detalles del procedimiento de cálculo los encontraréis al final del artículo.

Resultados en igualdad de condiciones

Este escenario permite cuantificar la importancia de la ventaja de seis puntos con que cuenta el Barcelona, ¿es muy importante o poco? Para averiguarlo asumo que ambos equipos tiene exactamente el mismo nivel —es decir, las mismas probabilidades de ganar/perder/empatar cada partido excepto el derbi— y que dicho nivel es un promedio de sus resultados de esta temporada.

El resultado de un millón de simulaciones se muestra en el histograma:

referencia.png

Podéis observar que en la mayoría de las simulaciones —área gris— el Barcelona acaba ganando la liga. Exactamente, los resultados indican que en “igualdad de condiciones” el Barcelona tendría un 81% de probabilidades de ganar mientras que el Real Madrid sólo un 12% (Hay un 6% de empates a puntos que en su mayoría acabarán siendo ligas del Barcelona por el Goal Average particular).

La misma conclusión se obtiene de las distribuciones de puntos de cada equipo (están desplazadas, siendo la del Barcelona superior):

referencia 2.png

Por cierto, que nadie se extrañe por el hueco en las distribuciones. Se trata de una de esas cosas que uno pasa por alto hasta que hace números: es posible que el Madrid llegue a 93 puntos en ocho partidos (ganando), pero es imposible que consiga exactamente 92.

A continuación vamos plantear otros escenarios para estimar las verdaderas probabilidades que tienen Madrid y Barcelona, teniendo en cuenta que su estado de forma y nivel puede ser diferente.

Resultados en otros escenarios

La siguiente tabla recoge los resultados obtenidos en 16 escenarios, donde el nivel de Real Madrid y FC Barcelona va cambiando (para saber los detalles consultad la tabla al final del artículo).

tabla_escenarios.png

Creo que la tabla es ilustrativa, pero voy a destacar algunos resultados:

  • El Real Madrid solo tendría un 7% de probabilidades de ser campeón si ambos equipos siguen al nivel de esta temporada (casilla 1).
  • Es más, si el Barcelona sigue a su nivel, el Madrid solo tendrá un 8% de probabilidades de victoria aunque estuviera al nivel de la remontada 2007 (casilla 13).
  • Los dos equipos están a un nivel excepcional: un “Madrid promedio” o un “Barcelona promedio” multiplican las probabilidades de victoria del rival.
  • Los números recientes abren la liga: el Madrid tendría un 47% de posibilidades de ser campeón si ambos equipos siguen al nivel mostrado desde la llegada de Juande —que coincidió con un bajón del Barcelona.
  • Si el Barcelona vuelve a su ritmo medio de esta temporada —el que le ha puesto lider— el Madrid aún tendría un 20% de posibilidades si mantiene su nivel actual.

Conclusión

Alguien dirá que no hemos llegado lejos —al fin y al cabo, no estamos en disposición de salir corriendo a una casa de apuestas— pero creo que sí tenemos una perspectiva mucho más precisa (¡cuantitativa!) de la situación: sabemos lo importante que es la ventaja del Barcelona, hemos visto lo excepcional que ha sido el rendimiento de los equipos y conocemos las opciones del Real Madrid en diferentes escenarios.

Por cierto, ¿Qué escenario creéis que es más plausible? ¿El Barcelona seguirá al nivel de todo el año o al nivel —inferior— de los últimos meses? Y el Madrid, ¿está Juande Ramos teniendo suerte o será consistente?

Apéndice: Procedimiento de cálculo
Para estimar las probabilidades que tiene el Madrid de ganar la liga he simulado varios millones de “ligas posibles” en diferentes escenarios, usando una especie de método de Monte Carlo.

Mi simulación asume las siguientes hipótesis:

  • Equipos: solo considero al Real Madrid y el FC Barcelona.
  • Inicio: el Barcelona tiene 75 puntos y el Real Madrid 69.
  • Partidos: Quedan siete partidos por disputar; no considero rival ni si el partido es fuera o en casa.
  • Probabilidades: a cada equipo le asigno una probabilidad de ganar/perder/empatar cada partido.
  • Derbi: hay un octavo partido que enfrenta a Real Madrid y Barcelona. Para definir sus probabilidades he usado los resultados de los últimos veinte años.

Así, cada simulación consiste en tres pasos:

  1. Simular de forma aleatoria los siete partidos de Real Madrid y Barcelona, con sus probabilidades.
  2. Simular el Derbi de igual forma.
  3. Sumar los puntos y determinar el ganador.

Si esto lo repetimos un millón de veces obtendremos la probabilidad que tiene cada equipo de ganar la liga (bajo las hipótesis mencionadas). Además, he repetido todo el procedimiento en diferentes escenarios, asignando diferentes probabilidades de ganar/perder/empatar a Real Madrid y Barcelona.

Sobre los escenarios. Para asignar las probabilidades de ganar/perder/empatar a cada equipo he optado por la solución más sencilla y natural: usar sus resultados pasados para definir las probabilidades. Por ejemplo, esta temporada el Madrid ha conseguido 23 victorias, 3 empates y tres derrotas, lo que se corresponde con un 72% de ganar, un 10% de empatar y un 17% de perder.

Asignar estas probabilidades al Real Madrid y el Barcelona que se van a disputar la liga es complicado, por eso he planteado diferentes escenarios:

Tabla probabilidades.png

Anotaciones vagamente relacionadas:



16 respuestas hasta ahora ↓

  • 1 Pepe // Apr 17, 2009 a las 22:10

    Bueno bueno kiko, al final has llevado tu amenaza a cabo.
    Y claramente ha pasado lo que todos nos temíamos. Ni el mismísimo As llegaría a unas conclusiones tan blancas!! Para mi que tú o el gominas habéis comprado al Monte Carlo ése (por cierto, no será arbitro verdad?).

    Que el Madrid tiene un 12% de ganar la liga dice!
    Todo el mundo sabe que es más fácil que Guardiola confiese su homosexualidad -un secreto a voces desde aquel incidente con su amigo Prosinecki- que que el Madrid de Juande gane la liga.
    Aunque quien sabe, mirado así todo es posible.

    Me entristece ver que no has tenido en cuenta el chorreo (7-1) que le endosó anteayer el Barça de Pep al Madrid de Juande Liz, inmortalizado para siempre en noquerraotro hace un par de días. Pero incluso en mi enajenación comprendo por qué no lo has hecho (una capturitaaaa… para darle color al post..vengaaa…).

    Tot el camp es un clam!

  • 2 Pablo Moreno Galbis // Apr 17, 2009 a las 22:55

    Hola Kiko,

    No acabo de entender porque necesitas utilizar millones de simulaciones Montecarlo en vez de pura suma de probabilidades. No hay más que sumar todas las combinaciones de resultados de 7 jornadas de liga que dan al Madrid como ganador y así sabrías la probabilidad con total exactitud.

    Un abrazo!
    Pablo

  • 3 Rober // Apr 18, 2009 a las 00:00

    Je je. Andaba yo con ganas de hacerlo, me he ahorrado el trabajo.

    Pero esto de la estadística y los números, no vale para los aficionados al fútbol: su equipo siempre es el mejor (o el peor si están cabreados con él).

    Por eso se inventó el término “matemáticamente”. Es decir, cuando un equipo tiene la liga ganada “matemáticamente” es que no hay más tu tía. La primera vez que lo oí, dije: vaya chorrada, si un equipo tiene la liga ganada, es porque la tiene ganada (matemáticamente), de lo contrario nunca la tiene segura.

    Pues no. Eso no funciona así. Es más complicado:

    - Si un equipo tiene una probabilidad media-alta de ganar la liga, se dice que “la tiene chupada” (o “la tiene segura” si se es más fino)
    - Si la tiene muy alta (pero no el 100%) se dice que “tiene el 100% de probabilidades”
    - Y si tiene el 100% de probabilidades, es cuando se dice que la “tiene matemáticamente ganada” (para distinguirla del 100%, claro)

    “Er fúrbo es asín”

  • 4 Ponzonha // Apr 18, 2009 a las 09:39

    ¿Sabes por qué me encanta el fútbol? Porque desafía todas las aproximaciones racionales a su estudio.
    Como ejercicio mental, cojonudo, pero la liga es del Barça al 100%.

  • 5 Luis // Apr 18, 2009 a las 10:46

    Según mi estudio sale que gana la liga el Osasuna… Habré fallado en algún pequeño detalle.
    Saludos.

  • 6 Rober // Apr 18, 2009 a las 11:16

    Completamente de acuerdo con Ponzonha: el fútbol no se puede predecir. Cualquier equipo, por pequeño que sea, puede ganar a un “grande”. Por ejemplo:

    Espanyol: 26 puntos
    Barça: 75 puntos (¡¡ casi 3 veces más !!)

    Jornada 24, Barcelona – Espanyol: 1 – 2

  • 7 Orayo // Apr 20, 2009 a las 11:55

    Rober, como cualquier equipo en un momento dado, por pequeño que sea, puede ganar a un grande se hacen un millon de simulaciones.

    Un estudio muy interesante. Veremos como acaba la liga y volveremos al post a ver si fueron muy acertadas las predicciones.

    Respondiendo a tu pregunta: Pienso que el Barcelona seguirá al nivel de todo el año anterior y el Madrid con suerte.

    salu2!

  • 8 Juan Gramage // Apr 20, 2009 a las 13:22

    Felicidades Kiko por atreverte con el fútbol.
    Respecto a la forma que mantendrán los dos equipos, hay que tener en cuenta un dato nada despreciable. El Barcelona todavía está dispuntando otras dos competiciones: la liga europea y la copa española.
    Un saludo.

  • 9 pinar // Apr 21, 2009 a las 14:48

    Muy divertido el análisis.

    Siempre me gustan tus gráficas pero ver una en la que el Madrid tiene pocas posibilidades de ganar la liga más todavía.

    De todos modos, tengo la misma duda que Pablo. ¿Porqué hacer una simulación en vez de un cálculo estadístico?

  • 10 Emilio // Apr 21, 2009 a las 15:20

    Pues yo apuesto por que el Madrid estará más o menos a “nivel Juande” y que el Barça estará en un punto intermedio entre “nivel Juande” y “nivel 2008-09″ porque, aunque es de esperar que no se despisten, siguen en las 3 competiciones, con el desgaste físico y psicológico que supone. Eso me sale unas posibilidades para el Madrid de entre 20 y 47%. No está tan mal, ¿no?

    Aunque bueno, habiendo transcurrido una jornada más y sin que nadie pinche, esos números se habrán reducido. Tendremos que confiar en el tradicional vértigo culé :)

    Kiko, aunque supongo que será un currazo, habría estado bien también ver, con un análisis parecido, que probabilidades tenía el Madrid de la remontada de ganar la liga. Seguro que tampoco eran muchas, pero se hizo.

    Por último, a los que decís del cálculo estadístico “a pelo”, imagino que el problema es que son muchas combinaciones posibles. Si no me equivoco salen (3^7)^2 (3 resultados posibles 1X2 en 7 jornadas y dos equipos), que son casi 5 millones. Aunque, releyendo el número de simulaciones de Monte Carlo que hace, veo que están cerca. No sé :)

  • 11 Kiko Llaneras // Apr 22, 2009 a las 09:01

    Pablo y Pinar, desde el principio decidí hacerlo con Monte Carlo por varias razones:

    1. Me era más sencillo (es una herramienta que conozco mejor)
    2. Podía mostrar los histogramas que creo que son bastante ilustrativos (aunque no tanto como pensé al principio)
    3. Y lo más importante, me permitía introducir más complejidad —condiciones if-else, por ejemplo— en caso de ser necesario.

    Así que no llegué a plantearme hacerlo con un árbol de combinaciones. Pero después de leer tu comentario y pensarlo creo que no sería sencillo. Como dice Emilio, son un montón de combinaciones posibles y habría que ver como implementarlo (seguramente con Matlab y varios bucles anidados la cosa saldría fácil). En definitiva, creo que tal y como esta definido el problema ahora misma se podría hacer, pero añadir determinadas cosas al modelo nos tiraría todo por el suelo.

    P.S. En realidad se llama “simulación” a cada iteración de Monte Carlo, pero en realidad es un cálculo estadístico a lo bruto. Usar los términos modelo y simulación es una deformación profesional seguramente.

  • 12 Kiko Llaneras // Apr 22, 2009 a las 09:09

    @Ponzonha, sí, como dices el fútbol desafía toda aproximación racional… ganará el Madrid ¿no? :-)

    @Orayo, un problema de este análisis es que no lo vamos a poder evaluar:

    Si gana el Madrid diré “veís, ya dije que tenía posibilidades”…
    … y si gana el Barca “sí, ya dije que era lo más probable”.

    @Juan, ¡muchas gracias! Respecto a las competiciones, yo creo que como dice Emilio más abajo es un criterio importante para elegir el escenario. Yo, madridista como él, me tiro por elegir lo mismo que él —que el “Madrid estará más o menos a «nivel Juande» y que el Barça estará en un punto intermedio entre “«nivel Juande» y «nivel 2008-09»”— lo que nos da bastantes opciones :-)

    P.S. Menudo partido el de ayer, Real Madrid – Getafe, cómo me lo pasé de bien.

  • 13 Emilio // Apr 27, 2009 a las 12:05

    Kiko, si rehaces los cálculos haznoslo saber, que creo que esas tartas tendrían ahora algo más de porción verde, ¿no? (o no, que también es cierto que quedan menos partidos)

  • 14 Kiko Llaneras // Apr 28, 2009 a las 10:08

    Sí, a ver si mañana saco un rato por la noche y puedo actualizarlo. Los cálculos salen rápido… costará un poco más hacer las figuras.

    Os mantengo informados.

  • 15 joa // May 8, 2009 a las 12:03

    Hola:
    he llegado a tu página por el buscador porque a estas alturas también estoy calculando (4 jornadas) las probabilidades de que gane el Barça:

    aprox. 98,5% de que gane el Barça
    aprox. 1,5 % de que gane el Madrid.

    Me he permitido usar dentro de “escenarios” las probabilidades 2008-2009 que has calculado para estos equipos

    Con un 95% de probabilidad la ventaja estará entre 1 y 10 puntos.

    A ver si te sale a ti algo parecido.

  • 16 Miguel // May 15, 2009 a las 20:05

    ¿Alguién me puede hacer el cálculo para el Xerez? Que probabilidades tiene de subir a 1ª (no que sea en 3º)
    Os juro que si me lo hacen rápido os mando la camiseta del Ascenso firmada por los jugadores…!!! Mi email es msf.miguel@ono.com

Deja tu comentario

Si quieres seguir leyendo