La estrategia basada en modelos estadísticos, cuya autoría es de Antonio Salmerón y Nicolás Pérez a partir de la tesis doctoral de este último, ha sido recogida en 'Predicting draws and number of fouls in football matches using Bayesian network classifiers' publicada en la prestigiosa revista Progress in Artificial Intelligence de Springer Editorial
La idea de partida es que el fútbol profesional genera cada vez más datos y es, en consecuencia, un ámbito óptimo desde el cual aplicar técnicas de ciencia de datos. ¿Cómo afrontar la gran incertidumbre de los resultados deportivos? La estrategia de los dos investigadores plantea una metodología capaz de afrontarla en función de la ganancia esperada.
El método se aplica al número de faltas y a la probabilidad de que un partido concluya en empate, siendo éste el resultado más difícil de anticipar. Pero señalan en el comunicado de la Universidad de Almería que esta forma de agrupar datos puede aplicarse en otros problemas de predicción donde interese anticipar sucesos raros o poco habituales.
El trabajo de campo se ha realizado con datos históricos de LaLiga desde la temporada 2010/2011 y propone agruparlos con el objetivo de mejorar la capacidad de predicción.
Los modelos estadísticos se han entrenado exclusivamente con datos disponibles de forma libre en internet por lo que son accesibles para todos.
A juicio de los investigadores, la gran ventaja de la utilización de clasificadores bayesianos frente a otros modelos de predicción como los basados en redes neuronales es que resultan fácilmente interpretables por humanos y es posible trazar el proceso que lleva al modelo a realizar una determinada predicción.