Oracle Cloud 数据分析解决方案为英超联赛两项大奖的评选提供信息支持

英超联赛深度分析来自所有 380 场比赛的海量数据,评出 2023-2024 赛季“最不可能的逆转”和“最强劲的进球”奖项得主。

Rob Preston | 2024 年 5 月 21 日


当下半场开始时,伯恩茅斯队 0 比 3 落后卢顿队,平局已不大可能,获胜更是奢望。然而,在短短 33 分钟内,伯恩茅斯队上演惊天逆转,震惊无数球迷。

伯恩茅斯队有机会拿下英超联赛 2023-2024 赛季“最不可能的逆转”大奖吗?通过分析所有 380 场比赛的 12 亿行数据,共计超过 100 亿个数据点,我们可以斩钉截铁地回答您:毫无问题!

5 月 21 日,英超联赛公布“最不可能的逆转”和“最强劲的进球”两个季末奖项得主,这两个奖项在评选上都得到了来自 Oracle Cloud Infrastructure (OCI) 服务的精确数据分析的大力支持。

其中,伯恩茅斯队在 3 月 13 日的主场作战中上演了从远远落后对手到 4 比 3 的惊人逆转,夺得了“最不可能的逆转”奖杯;阿斯顿维拉队的边锋 Moussa Diaby 在 3 月 30 日对狼队一战中射出了闪电般的一球,震撼全场,捧回了“最强劲的进球”奖杯。

为了顺利评出奖项得主,英超联赛联手 Oracle,在 Oracle 数据科学家的帮助下使用先进的 OCI 服务分析海量赛事数据。以下是英超联赛奖项评选过程中数据分析的幕后故事。

“最不可能的逆转”奖是如何评选的?

Oracle 数据科学家 Brian Macdonald 使用 Win Probability 数据来筛选英超联赛“最不可能的逆转”这一团队奖项的候选人。Win Probability 是一个第三方统计工具,它通过 100000 次比赛走势模拟来计算每场比赛中每支球队的获胜或平局概率。

Win Probability 统计模型基于 Stats Perform 生成的多年比赛数据,综合每场比赛不同时段的比分、比赛剩余时间、各队的场上球员数量(可能有球员被红牌罚下)以及主客场状态来计算获胜或平局概率。

英超联赛 2023-2024 赛季共计 380 场比赛,每一场比赛中,Oracle 都使用 OCI Data Science Service 来每 30 秒分析一次各队的获胜概率,计算哪支球队最有可能逆转最低获胜概率,击败对手。

对于“最不可能的逆转”奖项得主伯恩茅斯队,OCI Data Science 一度认为卢顿队会在下半场以 49 比 44 的比分赢得比赛,获胜概率高达 97.6%,是 2023-2024 赛季所有最终输掉比赛的球队中最高的。当时,伯恩茅斯队的获胜概率仅仅只有 0.4%。

伯恩茅斯队和卢顿队进球追踪表


“最不可能的逆转”奖之伯恩茅斯队和卢顿队获胜概率图

“最强劲的进球”奖:毫无悬念!

英超联赛“最强劲的进球”奖旨在表彰从射门瞬间到足球越过门线的平均速度最快的进球的射门球员,评选范围是从罚球区的 18 码线外射门且没有经过其他球员折射的进球。

OCI Data Science 分析结果显示,在 3 月 30 日对狼队的比赛中,阿斯顿维拉队边锋 Moussa Diaby 的一次射门的平均速度达到 68.25 英里每小时(109.84 千米每小时)。另外,水晶宫队的 Eberechi Eze 在 5 月 19 日对阿斯顿维拉队的比赛中踢出了 65.01 英里每小时的平均射门速度,是英超联赛 2023-2023 赛季中唯二平均射门速度超过 65 英里每小时的球员。

数据显示,第 10 名与第 2 名相差仅 3.2 英里每小时。“前 10 名中剩余球员的表现都非常接近。”Macdonald 表示,“每一名都只比后一名快一点点,而第一名却将第二名远远甩在身后。”

在家观赛的球迷可能很难体会到这种震撼,尤其是当一些射门掠过球场地面或飞入球门顶角时。“这就是为什么数据分析对于奖项评选至关重要的原因。”英超联赛首席商务官 Will Brass 表示,“整个计算过程非常复杂,不仅涉及球员和足球追踪,还要对球被击中的那一刻进行详细分析。而 Oracle Cloud Infrastructure 让我们能够可靠进行精确计算,清晰无误地评出当之无愧的奖项得主。”

不难想象,所有最终入围“最强劲的进球”评选的射门都是从刚刚脱离罚球区,从接近球门中心的位置射出的。“这很好理解。”Macdonald 表示,“据我观察,在很多射门中,足球都是通过折射传球回到远离球门的射门球员脚下的,因为这能够带来更高的射门速度。这是基本的物理学原理。”

平均速度最高的进球射门统计表

OCI 环境的设置和使用

Macdonald 表示,对于这两个奖项的评选,他只需要短短 30 分钟就能完成 OCI 实例设置。

第一步是在 OCI Compute 虚拟机上编写 Bash 脚本,使用 Bash 脚本,经由英超联赛两大主要数据服务提供商的 API 获取数据,然后将数据注入 OCI Object Storage。这些脚本将在每一个比赛日结束后拉取最新数据。

其中,供应商 Second Spectrum 使用机器学习和计算机视觉算法,提供每一场比赛中两支球队所有 22 名上场球员的位置数据(3D 坐标)和足球数据。供应商 Stats Perform 则使用其 Opta 服务增强位置数据,识别比赛“事件”,例如射门(包括射门位置、与球门距离以及球员惯用脚)、角球、犯规和点球等等。

接下来,Macdonald 将数据上传到 Oracle Autonomous Data Warehouse,使用这一基于云技术的数据仓库的内置 JSON 功能来处理复杂的嵌套 JSON 结构。然后,他使用 OCI Data Science 机器学习平台执行一系列深度分析。

Macdonald 基于来自所有 380 场比赛的数十亿个数据点开展分析,计算关于每一场比赛和每一个进球的无数指标,然后为每一个奖项输出一个简短的候选列表,最后评选出最终得主。

“整个过程中最复杂的可能就是连接两个数据服务提供商的 API 了,我们必须通过首次认证。”Macdonald 表示,“只要通过了认证,剩下就是一遍又一遍地重复运行命令了。这些就非常简单了。”

英超联赛奖项相关数据计算架构示意图
Oracle 数据科学家使用以上架构计算英超联赛奖项数据

过去三个赛季中,OCI 环境一直都在每场比赛结束后更新积分榜和仪表盘信息,为英超联赛评选“最不可能的逆转”和“最强劲的进球”这两大季末奖项提供数据和分析结果。英超联赛还在社交媒体上发布 OCI 的初步计算结果,宣传推广特殊赛事与进球。当然,最有实力候选人的信息始终是严格保密的。

Macdonald 表示:“我们进行大量的深度分析和深入讨论,不断验证和对比数据,确保不遗漏任何一个细节。”

使用的主要 OCI 产品

OCI Data Science Service 是所有分析工作的“支柱”,是专为数据科学团队构建、训练和管理高质量的机器学习模型而设计的全托管式无服务器平台。其自动化机器学习功能可快速检验数据,提出最佳算法建议,同时持续调优机器学习模型,解释机器学习结果。

OCI Data Science 提供拖放式数据集成和准备工具,帮助用户轻松将数据移动到数据湖或数据仓库。云技术平台的安全工具和用户界面支持多种角色的用户参与项目和分享模型。模型中立的解释功能可增强数据科学家、分析师和高管对机器学习结果的信心。

Oracle Autonomous Data Warehouse 是一项基于云技术的数据仓库服务,它可自动进行供应、配置、打补丁、调优、扩展和备份,从而消除操作复杂性。

OCI Compute 提供快速、灵活、经济的计算服务 — 从裸金属服务器和虚拟机到轻量级容器 — 适用于所有工作负载。OCI Compute 独有的灵活虚拟机和裸金属实例可以提供出色的性价比。

OCI Object Storage 支持用户以原生数据格式安全地存储所有类型的数据。得益于内置冗余,OCI Object Storage 非常适合构建高度可扩展和高度灵活的现代应用,通常用于整合多个数据源以进行分析、备份或归档。

Macdonald 还使用 Oracle Analytics Cloud 为每一个奖项构建信息全面的积分榜,基于不同标准重新进行数据分类,例如从“最强劲的进球”奖项候选人数据中识别大禁区 18 码线内射门,或者将分析范围缩小到特定球队。

Oracle Analytics Cloud 提供一个全面的工具套件来提取和分享数据洞察。该平台不仅支持分析师在任意设备上对任意数据洞察执行可视化,还支持用户使用一系列算法摄取、分析和清洗数据,聚合数据,然后规模化地运行机器学习模型。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。