Los ganadores de los premios Most Improbable Comeback y Most Powerful Goal se determinan a partir de datos analizados de los 380 partidos.
Rob Preston | 21 de mayo de 2024
Cuando el Bournemouth de la Premier League iba perdiendo contra el Luton Town por tres goles al comienzo de la segunda mitad, un empate parecía improbable y una victoria casi imposible. Después de cuatro goles de Bournemouth en el lapso de 33 minutos, los aficionados no podían creer lo que acababan de presenciar.
Pero, ¿fue realmente el Most Improbable Comeback de la temporada 2023-2024 de la Premier League? Después de analizar los datos —1,2 mil millones de filas, que suman más de 10 mil millones de puntos de datos de los 380 partidos— determinamos que absolutamente lo fue.
Most Improbable Comeback es uno de los dos premios de final de temporada que la Premier League anunció el 21 de mayo, cada uno de ellos basado en un riguroso análisis de datos utilizando los servicios de Oracle Cloud Infrastructure (OCI).
El Bournemouth se lleva a casa el trofeo del Most Improbable Comeback, por su victoria por 4-3 en casa el 13 de marzo. Igualmente impresionante fue el Most Powerful Goal de la temporada, por el cual el extremo del Aston Villa, Moussa Diaby, se llevó el trofeo por su potente disparo contra Wolverhampton el 30 de marzo.
Para llegar a los ganadores de los premios, la Premier League se asoció con Oracle, que asignó a un científico de datos para analizar las enormes cantidades de datos de los partidos utilizando varios servicios avanzados de OCI. A continuación, se ofrece un detrás de cámaras de ese análisis.
El científico de datos de Oracle, Brian Macdonald, llegó a los candidatos para este premio de equipo de la Premier League utilizando la estadística de Probabilidad de Victoria, una estadística de terceros que calcula la probabilidad de que un equipo consiga una victoria o empate en cada partido simulando el resto del partido 100 000 veces.
Ese modelo estadístico, basado en varios años de datos de partidos generados por Stats Perform, tiene en cuenta el marcador actual en diferentes momentos del partido, el tiempo restante en un partido dado, el número de jugadores en el campo para cada equipo (para tener en cuenta a los jugadores expulsados por una tarjeta roja), y si un equipo juega como local o visitante.
Utilizando OCI Data Science Service, Oracle analizó las probabilidades de victoria para cada equipo en intervalos de 30 segundos para cada uno de los 380 partidos de la temporada, con el fin de calcular qué equipo remontó desde la probabilidad de victoria más baja para derrotar a su oponente.
Para el ganador del Most Improbable Comeback, Bournemouth, OCI Data Science determinó que Luton tenía una probabilidad de victoria del 97,6 % a los 49:44 en la segunda mitad, el porcentaje más alto de cualquier equipo durante la temporada que luego perdió el partido. En este punto, Bournemouth tenía solo un 0,4 % de probabilidad de ganar.
Este premio de la Premier League reconoce al jugador cuyo disparo para marcar un gol tuvo la velocidad promedio más alta desde el momento en que fue golpeado hasta el momento en que cruzó la línea de gol, con la salvedad de que el disparo fue desde fuera del área de 18 yardas y no fue desviado.
El análisis de OCI Data Science reveló que el disparo de Moussa Diaby contra Wolves el 30 de marzo tuvo una velocidad promedio de 68,25 millas por hora (109,84 kilómetros por hora). Solo otro gol durante la temporada 2023-24 de la Premier League fue más rápido que 65 mph o 104,607 kilómetros por hora (el disparo de 65,01 mph de Eberechi Eze del Crystal Palace contra Aston Villa el 19 de mayo).
La diferencia entre el décimo lugar y el segundo lugar fue solo de 3,2 mph. "El resto del top 10 en esta categoría estaban todos bastante cerca", dice Macdonald. "Cada incremento era pequeño, y luego boom, hay un gran salto para el ganador".
Para los aficionados que ven en casa, puede ser difícil discernir entre disparos de tal potencia, especialmente cuando algunos rozan la superficie del campo y otros vuelan hacia la esquina superior de la portería. "Esa es una de las razones por las cuales el análisis de datos detrás de estos premios es tan importante", dice Will Brass, director comercial de la Premier League. "Los cálculos son complejos e involucran el seguimiento de los jugadores y del balón, así como un análisis detallado del momento en que el balón es golpeado. Oracle Cloud Infrastructure nos da confianza en cuanto a la precisión de estos cálculos y nos permite tener claridad al declarar un ganador que lo merezca".
Como era de esperar, todos los finalistas para Most Powerful Goal fueron disparos desde cerca del centro de la portería justo fuera del área. "Tiene sentido", dice Macdonald, "porque al observar estos disparos, muchos de ellos implican pases desviados que regresan al tirador, alejados de la portería, lo que le da al balón una velocidad extra. Es simplemente física básica".
Macdonald dice que pudo configurar las instancias de OCI aplicadas a ambas evaluaciones de premios en solo 30 minutos.
El primer paso fue escribir scripts Bash en máquinas virtuales de OCI Compute para extraer datos de las API de los dos principales proveedores de datos de la Premier League y ponerlos en OCI Object Storage. Esos scripts extraían datos actualizados después de cada día de partido.
Un proveedor es Second Spectrum, que suministra datos de ubicación sobre la posición (coordenadas 3D) de los 22 jugadores en el campo, así como del balón, durante cada partido de la Premier League utilizando algoritmos de aprendizaje automático y visión por computadora. El otro proveedor es Stats Perform, cuyo servicio Opta mejora los datos de ubicación para identificar "eventos" del partido, como disparos (incluyendo su ubicación en el campo, distancia a la portería y si fueron con el pie izquierdo o derecho), tiros de esquina, faltas, penaltis y así sucesivamente.
A partir de ahí, Macdonald cargó los datos en Oracle Autonomous Data Warehouse, utilizando las capacidades JSON integradas del almacén de datos en la nube para manejar las estructuras JSON complejas y anidadas necesarias para representar un partido de fútbol. Luego realizó una serie de análisis en profundidad utilizando la plataforma de aprendizaje automático OCI Data Science.
En total, el análisis tomó miles de millones de puntos de datos de los 380 partidos para calcular innumerables métricas sobre cada juego y gol, con el fin de generar finalmente una lista corta de candidatos para cada premio, y finalizar con la selección la de la Premier League de un solo ganador en cada categoría.
"Conectarse a las API de los dos proveedores de datos fue probablemente la parte más complicada, porque tuvimos que pasar por los pasos normales de autenticación por primera vez", dice Macdonald. "Tan pronto como conseguí que funcionaran, fue solo ejecutar los mismos comandos una y otra vez. El resto fue fácil".
El entorno de OCI ha estado produciendo los resultados para los dos premios de fin de temporada de la Premier League durante las últimas tres temporadas, actualizando las tablas de clasificación y los paneles para todos los premios después de cada partido. Los resultados preliminares se utilizaron en las redes sociales para ayudar a promocionar estos eventos y goles especiales a lo largo de la temporada, manteniendo en secreto a los principales candidatos.
Macdonald explica: "Hicimos muchos análisis en profundidad y discusiones sobre los resultados, validando y comparando los datos, asegurándonos de que no nos perdiéramos nada".
OCI Data Science Service, el eje de los análisis, es una plataforma completamente gestionada y sin servidor para que los equipos de ciencia de datos construyan, entrenen y gestionen modelos de aprendizaje automático de alta calidad. Las capacidades de aprendizaje automático automatizado examinan rápidamente los datos y recomiendan los algoritmos óptimos, ajustando el modelo y explicando sus resultados.
Las herramientas de integración y preparación de datos de arrastrar y soltar de OCI Data Science facilitan a los usuarios mover datos a un lago de datos o almacén de datos. Las herramientas de seguridad de la plataforma en la nube y las interfaces de usuario permiten a los usuarios con múltiples roles participar en proyectos y compartir modelos. Las explicaciones independientes del modelo ayudan a los científicos de datos, analistas de negocios y ejecutivos a tener confianza en los resultados.
Oracle Autonomous Data Warehouse es un servicio de almacén de datos en la nube que elimina las complejidades operativas mediante la automatización de la provisión, configuración, parcheo, ajuste, escalado y respaldo.
OCI Compute proporciona capacidad de cómputo rápida, flexible y asequible, desde servidores bare metal y máquinas virtuales hasta contenedores ligeros, para adaptarse a cualquier carga de trabajo. Las instancias de VM y bare metal de OCI Compute, únicas en su flexibilidad, ofrecen un rendimiento óptimo en relación al precio.
OCI Object Storage permite a los usuarios almacenar de manera segura cualquier tipo de datos en su formato nativo. Con redundancia integrada, OCI Object Storage es ideal para crear aplicaciones modernas que requieren escalabilidad y flexibilidad, ya que se puede usar para consolidar múltiples fuentes de datos con fines de analítica, copias de seguridad o archivo.
Macdonald también utilizó Oracle Analytics Cloud para presentar una tabla de clasificación completa para cada premio, lo que le permitió reordenar los datos en función de diferentes criterios, por ejemplo, para incluir a los candidatos a Most Powerful Goal para disparos que ocurrieron dentro del área de 18 yardas o reducir el análisis a jugadores de un equipo determinado.
Oracle Analytics Cloud proporciona un conjunto completo de herramientas para derivar y compartir conocimientos de datos. La plataforma permite a los analistas visualizar cualquier hallazgo de datos en cualquier dispositivo. También permite a los usuarios ingerir, perfilar y limpiar datos utilizando una variedad de algoritmos, así como agregar datos y luego ejecutar modelos de aprendizaje automático (ML) a gran escala.
La plataforma Oracle Analytics es un servicio nativo en la nube que proporciona las capacidades necesarias para abordar todo el proceso de analítica, incluida la ingestión y modelado de datos, y la visualización y colaboración, sin comprometer la seguridad y la gobernanza.
Con inteligencia artificial impulsada por Oracle Cloud Infrastructure (OCI), la liga está proporcionando a los aficionados información sobre el rendimiento de equipos y jugadores.