يُقدم تحليل بيانات Oracle Cloud جائزتين من الدوري الإنجليزي الممتاز

يتم تحديد الفائزين بأقوى أداء في الموسم وأقوى الأهداف من خلال البيانات التي تم جمعها من جميع المباريات الـ 380.

روب برستون | 21 مايو 2024


عندما كان فريق بورنموث المنتمي للدوري الإنجليزي الممتاز متخلفًا عن لوتون تاون بثلاثة أهداف في بداية الشوط الثاني، بدأ التعادل غير محتمل والفوز شبه مستحيل. بعد أربعة أهداف لفريق بورنموث في غضون 33 دقيقة، لم يصدق المشجعون ما شاهدوه للتو.

لكن هل كانت هذه، في الواقع، العودة الأكثر احتمالاً في موسم الدوري الإنجليزي الممتاز لعام 2023-2024؟ وبعد تحليل البيانات - 1.2 مليار صف منها، بإجمالي أكثر من 10 مليار نقطة بيانات من جميع التطابقات البالغ عددها 380 - قررنا أنها كانت كذلك بالتأكيد.

تعد "العودة غير المحتملة" واحدة من جائزتين في نهاية الموسم أعلنهما الدوري الإنجليزي الممتاز في 21 مايو، وتعتمد كل منهما على تحليل دقيق للبيانات باستخدام خدمات Oracle Cloud Infrastructure (OCI).

حصل فريق بورنموث على كأس العودة غير المحتملة بعد فوزه بنتيجة 4-3 على أرضه في 13 مارس. كان الهدف المذهل بنفس القدر هو أقوى هدف في الموسم، حيث حصل جناح أستون فيلا اللاعب موسى ديابي على الكأس بعد هدفه بالليزر ضد ولفرهامبتون في 30 مارس.

وللوصول إلى الفائزين بالجوائز، عقد الدوري الإنجليزي الممتاز شراكة مع شركة Oracle، التي نشرت عالم بيانات لتحليل الكميات الهائلة من بيانات المباريات باستخدام العديد من خدمات OCI المتطورة. فيما يلي نظرة من وراء الكواليس على هذا التحليل.

العودة الأكثر احتمالاً: كيف يتم احتسابها

توصل عالم تحليل البيانات في Oracle، بريان ماكدونالد، إلى المرشحين للحصول على جائزة فريق الدوري الإنجليزي الممتاز باستخدام إحصائية احتمالية الفوز، وهي إحصائية تابعة لجهة خارجية تحسب فرصة فوز الفريق أو تعادله في كل مباراة من خلال محاكاة ما تبقى من المباراة 100 ألف مرة.

يعتمد هذا النموذج الإحصائي على عدة سنوات من بيانات المباراة التي تم إنشاؤها بواسطة Stats Perform، ويأخذ في الاعتبار النتيجة الحالية في أوقات مختلفة خلال كل مباراة،، والوقت المتبقي في مباراة معينة، وعدد اللاعبين في الملعب لكل فريق (لحساب أي لاعب يتم طرده بسبب البطاقة الحمراء)، وما إذا كان الفريق في الوطن أم خارجه.

باستخدام خدمة علوم البيانات OCI، حللت Oracle احتمالات الفوز لكل فريق في فواصل زمنية مدتها 30 ثانية لكل مباراة من مباريات الموسم البالغ عددها 380 مباراة لحساب الفريق الذي عاد من أقل احتمالية فوز لهزيمة خصمه.

بالنسبة إلى الفائز الأكثر احتمالاً في العودة، فريق بورنموث، قررت OCI Data Science أن لوتون لديه احتمال فوز بنسبة 97.6% عند الدقيقة 49:44 في الشوط الثاني، وهي أعلى نسبة لأي فريق خلال الموسم الذي خسر المباراة. في هذه المرحلة كان لدى فريق بورنموث فرصة 0.4% فقط للفوز.

جدول تتبع الأهداف لنادي فريق بورنموث ولوتون تاون


الرسم البياني الأكثر احتمالاً للفوز بنسبة العودة بين فريق بورنموث ولوتون تاون

الهدف الأقوى: تعلن البيانات فائزًا واضحًا

تُمنح جائزة الدوري الإنجليزي الممتاز هذه للاعب الذي حققت تسديدته التي سجل هدفًا أعلى متوسط سرعة من وقت تسديدها إلى وقت عبورها خط المرمى، مع التحذيرات بأن الضربة كانت من خارج خط الـ 18 ياردة ولم يتم انحرافها.

كشف تحليل OCI Data Science أن ضربة اللاعب موسى ديابي ضد ولفرهامبتون في 30 مارس كان متوسط سرعتها 68.25 ميلًا في الساعة (109.84 كيلومترًا في الساعة). هدف واحد آخر فقط خلال موسم الدوري الإنجليزي الممتاز لعام 2023-2024 كان أسرع من 65 ميلاً في الساعة (ضربة 65.01 ميلاً في الساعة التي سجلها إيبريتشي إيز لاعب كريستال بالاس ضد أستون فيلا في 19 مايو).

وكانت الفجوة بين المركزين العاشر والثاني بمقدار 3.2 ميل في الساعة فقط. صرح ماكدونالد: "كانت بقية المراكز العشرة الأولى في هذه الفئة متقاربة نوعًا ما". "كانت كل زيادة صغيرة، وبعد ذلك، كانت هناك قفزة كبيرة للفائز."

بالنسبة للجماهير التي تشاهد الكرة في المنزل، قد يكون من الصعب التمييز بين التسديدات التي تتمتع بهذه القوة، خاصة عندما تتخطى بعض التسديدات سطح الملعب وتتجه تسديدة أخرى إلى الزاوية العليا للمرمى. صرح ويل براس، كبير المسؤولين التجاريين في الدوري الإنجليزي الممتاز: "هذا أحد الأسباب وراء أهمية تحليلات البيانات وراء هذه الجوائز". "إن الحسابات معقدة، وتتضمن تتبع اللاعب والكرة بالإضافة إلى تحليل مفصل للحظة ضرب الكرة. تمنحنا خدمة Oracle Cloud Infrastructure الثقة في هذه الحسابات الدقيقة وتتيح لنا الوضوح في إعلان الفائز المستحق."

وكما هو متوقع، جميع المرشحين النهائيين لأقوى هدف كانوا من تسديدات قريبة من منتصف المرمى خارج منطقة الجزاء مباشرةً. صرح ماكدونالد: "هذا أمر منطقي، لأنني عندما أنظر إلى هذه التسديدات، فإن الكثير منها يتضمن تمريرات غير اتجاهية تعود إلى الرامي، بعيدًا عن المرمى، مما يمنح الكرة سرعة إضافية. إنها مجرد لعبة فيزيائية أساسية".

جدول يوضح تسديدات تسجيل الأهداف ذات أعلى سرعة متوسطة

الإعداد، باستخدام بيئة خدمات OCI

يقول ماكدونالد إنه كان قادرًا على إعداد مثيلات OCI المطبقة على تقييمي الجوائز في غضون 30 دقيقة فقط.

كانت الخطوة الأولى هي كتابة نصوص Bash النصية على أجهزة OCI Compute ظاهرية لسحب البيانات من واجهات برمجة التطبيقات الخاصة بمزودي البيانات الرئيسيين في الدوري الإنجليزي الممتاز ووضعها في OCI Object Storage. وتقوم هذه البرامج النصية بسحب البيانات المحدثة بعد كل يوم مباراة.

وأحد المزودين هو شركة Second Spectrum، التي توفر بيانات الموقع حول تحديد المواقع (الإحداثيات ثلاثية الأبعاد) لجميع اللاعبين الـ 22 على أرض الملعب، بالإضافة إلى الكرة، طوال كل مباراة في الدوري الإنجليزي الممتاز باستخدام خوارزميات التعلم الآلي والرؤية الحاسوبية. المزود الآخر هو Stats Perform، الذي تعمل خدمة Opta الخاصة به على تحسين بيانات الموقع لتحديد "أحداث" المباراة، مثل التسديدات (بما في ذلك موقعهم على أرض الملعب، وبعدهم عن المرمى، وما إذا كانوا يلعبون بالقدم اليسرى أو اليمنى) والركلات الركنية والأخطاء وركلات الجزاء وما إلى ذلك.

ومن هناك، قام ماكدونالد بتحميل البيانات إلى خدمة Oracle Autonomous Data Warehouse، باستخدام إمكانات JSON المضمنة في المستودع السحابي للتعامل مع هياكل JSON المعقدة والمتداخلة اللازمة لتمثيل مباراة كرة قدم. ومن ثم أجرى سلسلة من التحليلات المتعمقة باستخدام منصة التعلم الآلي لعلوم البيانات OCI.

وفي المجمل، اعتمد التحليل على مليارات نقاط البيانات من جميع المباريات الـ 380 لحساب عدد لا يحصى من المقاييس حول كل مباراة وهدف، مما أدى في النهاية إلى إنشاء قائمة قصيرة من المرشحين لكل جائزة، وبلغت ذروتها في اختيار الدوري الإنجليزي الممتاز لفائز واحد في كل فئة.

وصرح ماكدونالد: "ربما كان الاتصال بواجهات برمجة التطبيقات الخاصة بمزودي البيانات هو الجزء الأكثر تعقيدًا، لأنه كان علينا العمل من خلال خطوات المصادقة العادية لأول مرة". "بمجرد أن أجعل تلك الخطوات تعمل، يتم تشغيل نفس الأوامر مرارًا وتكرارًا. وما بعد ذلك، أمره سهل".

رسم تخطيطي للبنية المستخدمة لحساب جوائز الإحصائيات
استخدم علماء بيانات Oracle البنية الموضحة أعلاه لحساب الجوائز.

أنتجت بيئة OCI نتائج الدوري الإنجليزي الممتاز في نهاية الموسم على مدار المواسم الثلاثة الماضية، حيث قامت بتحديث بيانات المتصدرين ولوحات المعلومات لكل جائزة بعد كل مباراة. تم استخدام النتائج الافتتاحية على وسائل التواصل الاجتماعي للمساعدة في الترويج لهذه الأحداث والأهداف الخاصة طوال الموسم، مع الحفاظ على سرية المرشحين الرئيسيين.

وأوضح ماكدونالد: "لقد أجرينا الكثير من التحليلات والمناقشات المتعمقة للنتائج، والتحقق من صحة البيانات ومقارنتها، لضمان عدم تفويت أي شيء".

منتجات OCI الأساسية المستخدمة

تعد خدمة OCI Data Science Service، نقطة ارتكاز التحليلات، عبارة عن نظام أساسي مُدار بالكامل وبدون خادم لفرق علوم البيانات لإنشاء نماذج تعلم آلي عالية الجودة وتدريبها وإدارتها. تعمل إمكانات التعلم الآلي المؤتمتة على فحص البيانات بسرعة والتوصية بالخوارزميات المثالية، مع ضبط النموذج وشرح نتائجه.

تسهل أدوات تكامل البيانات وإعدادها بطريقة السحب والإفلات في OCI Data Science على المستخدمين نقل البيانات إلى مخزن البيانات أو مستودع البيانات. تتيح أدوات أمان النظام الأساسي للسحابة وواجهات المستخدم للمستخدمين الذين لديهم أدوار متعددة المشاركة في المشاريع ومشاركة النماذج. تُعين التفسيرات المحايدة للنموذج علماء البيانات ومحللي الأعمال والمديرين التنفيذيين على الثقة في النتائج.

Oracle Autonomous Data Warehouse هي خدمة مستودع بيانات مستندة إلى السحابة تعمل على التخلص من التعقيدات التشغيلية عن طريق أتمتة التزويد والتكوين والتصحيح والضبط والقياس والنسخ الاحتياطي.

توفر خدمة OCI Compute قدرة حوسبة سريعة ومرنة وبأسعار معقولة - بدءًا من الخوادم المعدنية والأجهزة الافتراضية وحتى الحاويات خفيفة الوزن - لتناسب أي حمل عمل. توفر المثيلات الظاهرية والمثيلات المعدنية المرنة الفريدة من نوعها من OCI Compute أداءً مثاليًا من حيث السعر.

تُمكن خدمة OCI Object Storage المستخدمين من تخزين أي نوع من البيانات بشكل آمن بتنسيقه الأصلي. مع التكرار المضمن، يعد تخزين كائنات OCI مثاليًا لبناء تطبيقات حديثة تتطلب حجمًا ومرونة، حيث يمكن استخدامه لتوحيد مصادر بيانات متعددة لأغراض التحليلات أو النسخ الاحتياطي أو الأرشفة.

استخدم ماكدونالد أيضًا خدمة Oracle Analytics Cloud لتقديم لوحة صدارة كاملة لكل جائزة، مما يسمح له بإعادة فرز البيانات بناءً على معايير مختلفة، على سبيل المثال، لتضمين أقوى الأهداف المرشحة للتسديدات التي حدثت داخل منطقة الـ 18 ياردة أو تضييق التحليل ليشمل اللاعبين في فريق معين.

وتوفر خدمة Oracle Analytics Cloud مجموعة كاملة من الأدوات لاستخلاص رؤى البيانات ومشاركتها. كما يتيح النظام الأساسي للمحللين تصور أي نتائج بيانات على أي جهاز. ويتيح أيضًأ للمستخدمين استيعاب البيانات وملفها التعريفي وتصحيحها باستخدام مجموعة متنوعة من الخوارزميات، بالإضافة إلى تجميع البيانات ثم تشغيل نماذج التعلم الآلي على نطاق واسع.