Die Gewinner der Kategorien Most Improbable Comeback und Most Powerful Goal wurden anhand der Daten aller 380 Spiele ermittelt.
Rob Preston | 21. Mai 2024
Als Bournemouth in der Premier League zu Beginn der zweiten Halbzeit gegen Luton Town mit drei Toren zurücklag, schien ein Unentschieden unwahrscheinlich und ein Sieg fast unmöglich. Nach vier Toren von Bournemouth innerhalb von 33 Minuten konnten die Fans nicht glauben, was sie da gerade gesehen hatten.
Aber war es tatsächlich das unwahrscheinlichste Comeback der Premier League-Saison 2023/2024? Nach der Auswertung aller Daten (1,2 Milliarden Zeilen mit insgesamt mehr als 10 Milliarden Datenpunkten aus allen 380 Übereinstimmungen) stellten wir fest, dass es das in der Tat war.
Die Auszeichnung Most Improbable Comeback ist eine von zwei Auszeichnungen, die die Premier League zum Saisonende am 21. Mai bekannt gab. Beide Auszeichnungen basieren auf einer sorgfältigen Datenanalyse mithilfe der Oracle Cloud Infrastructure-(OCI-)Services.
Bournemouth erhält die Trophäe für das unwahrscheinlichste Comeback nach einem 4:3-Sieg im Heimspiel am 13. März. Ebenso beeindruckend war das wuchtigste Tor der Saison (Most Powerful Goal), für das Aston Villa-Stürmer Moussa Diaby mit seinem Strahl gegen Wolverhampton am 30. März ausgezeichnet wurde.
Um die Preisträger zu ermitteln, arbeitete die Premier League mit Oracle zusammen, das einen Data Scientist einsetzte, um die riesigen Mengen an Spieldaten mithilfe mehrerer hochmoderner OCI-Services zu analysieren. Im Folgenden erhalten Sie einen Einblick hinter die Kulissen dieser Analyse.
Brian Macdonald, ein Data Scientist von Oracle, ermittelte die Kandidaten für diese Auszeichnung der Premier League anhand der Gewinnwahrscheinlichkeitsstatistik (Win Probability). Diese Statistik eines externen Anbieters berechnet die Chance eines Teams auf einen Sieg oder ein Unentschieden in jedem Spiel, indem der Rest des Spiels 100.000-mal simuliert wird.
Dieses statistische Modell, das auf den von Stats Perform generierten Spieldaten mehrerer Jahre basiert, berücksichtigt den aktuellen Spielstand zu verschiedenen Zeitpunkten während eines Spiels, die verbleibende Spielzeit, die Anzahl der Spieler auf dem Spielfeld für jede Mannschaft (um Spieler zu berücksichtigen, die wegen einer roten Karte ausgeschlossen wurden) und ob eine Mannschaft zu Hause oder auswärts spielt.
Mithilfe des OCI Data Science Service analysierte Oracle die Gewinnwahrscheinlichkeiten für jedes Team im 30-Sekunden-Takt für jedes der 380 Spiele der Saison, um zu berechnen, welches Team trotz der niedrigsten Gewinnwahrscheinlichkeit das Spiel noch drehte.
Für den Gewinner der Kategorie Most Improbable Comeback, Bournemouth, ermittelte OCI Data Science, dass Luton beim Stand von 49:44 in der zweiten Halbzeit eine 97,6-prozentige Gewinnwahrscheinlichkeit hatte – der höchste Prozentsatz aller Mannschaften in dieser Saison, die das Spiel anschließend verloren. Zu diesem Zeitpunkt hatte Bournemouth nur noch eine Chance von 0,4 % auf einen Sieg.
Mit dieser Auszeichnung der Premier League wird der Spieler geehrt, dessen Torschuss die höchste Durchschnittsgeschwindigkeit vom Zeitpunkt des Auftreffens bis zum Überqueren der Torlinie aufwies. Voraussetzung ist, dass der Schuss von außerhalb der Strafraumgrenze kam und nicht abgefälscht wurde.
Die Analyse von OCI Data Science ergab, dass der Treffer von Moussa Diaby gegen die Wolves am 30. März eine durchschnittliche Geschwindigkeit von 68,25 Meilen pro Stunde (109,84 Kilometer pro Stunde) erreichte. Nur ein weiteres Tor in der Premier League-Saison 2023/24 war schneller als 65 mph (der Treffer von Eberechi Eze von Crystal Palace gegen Aston Villa am 19. Mai mit 65,01 mph).
Der Abstand zwischen Platz 10 und Platz 2 betrug nur 3,2 mph (5,15 km/h). „Der Rest der Top 10 in dieser Kategorie lag ziemlich nah beieinander“, so Macdonald. „Jeder Schritt war klein, und dann, bumm, kam dieser große Sprung für den Gewinner.“
Für die Fans zu Hause kann es schwierig sein, zwischen Schüssen von solcher Wucht zu unterscheiden, vor allem, wenn einige Schüsse die Spielfeldoberfläche streifen und andere direkt ins Kreuzeck fliegen. „Das ist ein Grund, warum die Datenanalyse hinter diesen Auszeichnungen so wichtig ist“, so Will Brass, Chief Commercial Officer der Premier League. „Die Berechnungen sind komplex und umfassen die Verfolgung von Spieler und Ball sowie eine detaillierte Analyse des Zeitpunkts, an dem der Ball getroffen wird. Oracle Cloud Infrastructure gibt uns Sicherheit bei diesen präzisen Berechnungen und ermöglicht es uns, einen verdienten Sieger zu küren.“
Wie zu erwarten war, wurden alle Finalisten der Kategorie Most Powerful Goal für Schüsse aus der Nähe der Strafraummitte kurz vor der Strafraumgrenze ausgezeichnet. „Das ergibt Sinn“, so Macdonald, „denn viele dieser Schüsse sind abgefälschte Pässe, die zum Schützen zurückkommen, weg vom Tor, was dem Ball zusätzliche Geschwindigkeit verleiht. Das ist einfache Physik.“
Macdonald zufolge konnte er die OCI-Instanzen für beide Auszeichnungen in nur 30 Minuten einrichten.
Der erste Schritt bestand darin, Bash-Skripte auf den virtuellen Maschinen von OCI Compute zu schreiben, um Daten aus den APIs der beiden wichtigsten Datenanbieter der Premier League zu ziehen und sie in den OCI Object Storage zu übertragen. Diese Skripte schöpften nach jedem Spieltag aktualisierte Daten.
Einer der Anbieter ist Second Spectrum, der mithilfe von maschinellem Lernen und Computer-Vision-Algorithmen Standortdaten über die Position (3D-Koordinaten) aller 22 Spieler auf dem Spielfeld sowie des Balls während jedes Premier League-Spiels liefert. Der andere Anbieter ist Stats Perform, dessen Opta-Dienst die Standortdaten erweitert, um Spielereignisse wie Schüsse (einschließlich ihrer Position auf dem Spielfeld, der Entfernung zum Tor und der Angabe, ob sie mit dem linken oder rechten Fuß getreten wurden), Eckstöße, Fouls, Elfmeter usw. zu identifizieren.
Anschließend lud Macdonald die Daten in das Oracle Autonomous Data Warehouse hoch und nutzte die integrierten JSON-Funktionen des cloudbasierten Warehouse, um die komplexen, verschachtelten JSON-Strukturen zu verarbeiten, die für die Darstellung eines Fußballspiels erforderlich sind. Danach führte er eine Reihe eingehender Analysen mit der maschinellen Lernplattform OCI Data Science durch.
Insgesamt wurden bei der Analyse Milliarden von Datenpunkten aus allen 380 Spielen berücksichtigt, um unzählige Kennzahlen zu jedem Spiel und jedem Tor zu berechnen und schließlich eine kurze Liste von Kandidaten für jede Auszeichnung zu erstellen, aus der die Premier League dann einen einzigen Gewinner in jeder Kategorie auswählte.
„Die Verbindung zu den APIs der beiden Datenanbieter war wahrscheinlich der komplizierteste Teil, denn wir mussten die üblichen Schritte der erstmaligen Authentifizierung durchlaufen“, so Macdonald. „Sobald ich diese zum Laufen gebracht hatte, wurden einfach immer wieder dieselben Befehle ausgeführt. Der Rest war einfach.“
Die OCI-Umgebung hat in den letzten drei Spielzeiten die Ergebnisse für die beiden Auszeichnungen der Premier League am Ende der Saison erstellt und die Ranglisten und Dashboards für jede Auszeichnung nach jedem Spiel aktualisiert. Die vorläufigen Ergebnisse wurden in den sozialen Medien verwendet, um diese besonderen Ereignisse und Tore während der Saison zu bewerben, wobei die Spitzenkandidaten geheim gehalten wurden.
Macdonald erklärt: „Wir haben die Ergebnisse eingehend analysiert und diskutiert, die Daten validiert und verglichen, um sicherzustellen, dass wir nichts übersehen haben.“
OCI Data Science Service, der Dreh- und Angelpunkt der Analysen, ist eine vollständig verwaltete und serverlose Plattform für Data Science-Teams zum Erstellen, Trainieren und Verwalten hochwertiger maschineller Lernmodelle. Automatisierte ML-Funktionen untersuchen die Daten rasant und empfehlen die optimalen Algorithmen, während sie das Modell abstimmen und seine Ergebnisse erläutern.
Die Drag-and-Drop-Tools zur Datenintegration und -aufbereitung von OCI Data Science machen es den Benutzern leicht, Daten in einen Data Lake oder ein Data Warehouse zu verschieben. Die Sicherheitstools und Benutzeroberflächen der Cloud-Plattform ermöglichen es Benutzern mit verschiedenen Rollen, an Projekten teilzunehmen und Modelle gemeinsam zu nutzen. Modellunabhängige Erklärungen helfen Data Scientists, Business Analysts und Führungskräften, sich auf die Ergebnisse zu verlassen.
Oracle Autonomous Data Warehouse ist ein cloudbasierter Data Warehouse-Service, der durch die Automatisierung von Bereitstellung, Konfiguration, Patching, Tuning, Skalierung und Backup die operative Komplexität beseitigt.
OCI Compute bietet schnelle, flexible und erschwingliche Rechenkapazitäten – von Bare-Metal-Servern und virtuellen Maschinen bis hin zu leichtgewichtigen Containern – für jede Workload. Die einzigartig flexiblen VM- und Bare-Metal-Instanzen von OCI Compute sorgen für ein optimales Preis-Leistungs-Verhältnis.
OCI Object Storage ermöglicht es den Nutzern, jede Art von Daten in ihrem ursprünglichen Format sicher zu speichern. Durch die eingebaute Redundanz ist OCI Object Storage ideal für die Entwicklung moderner Anwendungen, die Skalierbarkeit und Flexibilität erfordern, da es zur Konsolidierung mehrerer Datenquellen für Analyse-, Sicherungs- oder Archivierungszwecke verwendet werden kann.
Macdonald nutzte außerdem Oracle Analytics Cloud, um eine vollständige Rangliste für jede Auszeichnung zu erstellen. So konnte er die Daten nach verschiedenen Kriterien neu sortieren, z. B. um die Kandidaten der Kategorie Most Powerful Goal für Schüsse innerhalb des Strafraums einzubeziehen oder die Analyse auf Spieler eines bestimmten Teams zu beschränken.
Oracle Analytics Cloud bietet eine umfassende Reihe von Tools für die Ableitung und den Austausch von Dateneinblicken. Die Plattform ermöglicht es Analysten, beliebige Datenergebnisse auf jedem beliebigen Gerät zu visualisieren. Darüber hinaus können Benutzer Daten mit einer Vielzahl von Algorithmen einspeisen, profilieren und bereinigen sowie Daten aggregieren und dann ML-Modelle in großem Umfang ausführen.
Die Oracle Analytics-Plattform ist ein Cloud-nativer Service, der die erforderlichen Funktionen für den gesamten Analyseprozess bietet, einschließlich Dateneingabe und -modellierung sowie Visualisierung und Zusammenarbeit, ohne dabei die Sicherheit und Governance zu beeinträchtigen.
Mit der von Oracle Cloud Infrastructure (OCI) unterstützten künstlichen Intelligenz liefert die Liga den Fans Einblicke in Teams und Spielerleistungen.