6 تحديات شائعة لتدريب نموذج الذكاء الاصطناعي

مايكل تشن | خبير استراتيجيات المحتوى | 20 ديسمبر 2023

عندما يتعلق الأمر بمشروعات الذكاء الاصطناعي، فكل عملية تدريب نموذج مختلفة عن الأخرى. المجال والجمهور والموارد التقنية والقيود المالية، وحتى سرعة ومهارة المطورين كلها عوامل في المعادلة، ما يخلق مجموعة واسعة من التحديات.

على الرغم من أن كل مجموعة من صعوبات تدريب النموذج قد تكون فريدة من نوعها، إلا أنه توجد بعض السمات. تستعرض هذه المقالة ستة من أكثر المشاكل شيوعًا التي تم العثور عليها في أثناء تدريب نموذج الذكاء الاصطناعي وتقدم الحلول والسبل لكلٍ من فريق التطوير والمؤسسة ككل.

ما الذي يجعل تدريب نماذج الذكاء الاصطناعي صعبًا للغاية؟

وعلى الرغم من الزيادة السريعة في الموارد المتعلقة بالذكاء الاصطناعي، لا تزال عملية تدريب نموذج الذكاء الاصطناعي صعبة. تخلق بعض المشكلات مجموعة متزايدة من المشكلات: فمع زيادة قوة الموارد وتوفرها، تزداد تعقيدات نماذج الذكاء الاصطناعي. هل هي دقيقة؟ هل تقوم بالتوسع؟

النقاط الرئيسة

  • يمكن أن تشمل تحديات تدريب نماذج الذكاء الاصطناعي مجموعة واسعة من العوامل عبر المؤسسة بأكملها وتتجاوز المشكلات التقنية.
  • غالبًا ما يمكن حل التحديات التقنية من خلال زيادة مجموعات بيانات التدريب أو إضافة موارد سحابية خارجية لتوفير مزيد من قوة الحوسبة.
  • ويتطلب التغلب على هذه التحديات مزيجًا من الخبرة التقنية والعمليات المرنة وثقافة التعاون بين المساهمين

6 تحديات شائعة لتدريب نموذج الذكاء الاصطناعي

بدءًا من تحديد نطاق المشروع الأولي وحتى النشر النهائي لبدء التشغيل، يتطرق تدريب نموذج الذكاء الاصطناعي إلى العديد من الأقسام المختلفة. ومن منظور فني، تحتاج أقسام تكنولوجيا المعلومات إلى فهم متطلبات البنية الأساسية للأجهزة، ويجب على علماء البيانات التفكير في تدريب مصادر مجموعات البيانات، ويجب على المطورين وزن الاستثمارات في البرامج والأنظمة الأخرى.

من منظور تنظيمي، يحدد نوع مشروع الذكاء الاصطناعي الأقسام التشغيلية المتأثرة بالمشروع: قد يكون لدى فرق التسويق والمبيعات والموارد البشرية والفرق الأخرى مدخلات عن غرض المشروع أو نطاقه أو أهدافه.

وهذا يضيف الكثير من الطهاة في مطبخ تدريب نموذج الذكاء الصناعي. وكلما زاد عدد الطهاة، زادت القيود والمتغيرات، وكل هذا يزيد من التحديات التنظيمية. توضح القائمة التالية بشكل عميق ستة من أكثر التحديات شيوعًا التي تم اكتشافها في أثناء تدريب نموذج الذكاء الاصطناعي:

تشمل تحديات تدريب نماذج الذكاء الاصطناعي مشكلات فنية وتنظيمية. وإليك بعض المشكلات الشائعة التي تواجه المؤسسات اليوم.

تعرض هذه الصورة 6 تحديات خاصة بتدريب نموذج الذكاء الاصطناعي:

  • الأجهزة والبرامج: قيود موارد/قدرات الأجهزة والبرامج غير المتوافقة
  • الخوارزميات: تحديد نوع النموذج أو التجهيز الزائد أو التجهيز الناقص
  • مجموعات البيانات: بيانات غير كافية أو غير متوازنة أو رديئة الجودة
  • مجمع المواهب: سوق عمل محتدم ومنافسة للحصول على العاملين في مجال الذكاء الاصطناعي ذوي المهارة
  • إدارة المشاريع: فجوات الاتصال والتوقعات التي بها مشكلة بين الأقسام
  • إدارة البيانات: مخاوف الأمان والخصوصية والوصول والملكية عبر المؤسسة

1. التحديات المرتبطة بمجموعة البيانات

تُعد مجموعات بيانات التدريب الأساس لأي نموذج ذكاء اصطناعي. وهذا يعني أن جودةمجموعات بيانات التدريب واتساعها تحدد دقة البيانات التي ينتجها الذكاء الاصطناعي أو عدم وجودها. يمكن لمشكلات البيانات أن تشمل

  • البيانات غير المتوازنة: تنشئ البيانات غير المتوازنة تحيزًا في نموذج تدريب الذكاء الاصطناعي. فعلى سبيل المثال، إذا استخدم نموذج الذكاء الاصطناعي لبائع الملابس بالتجزئة بيانات الأحذية فقط، فلن يتمكن النموذج من التعامل مع المتغيرات التي تم إنشاؤها بشكل حصري من خلال تحديد مقاس القمصان أو الفساتين.
  • البيانات غير الكافية: عندما تعمل نماذج تدريب الذكاء الاصطناعي مع حجم صغير من البيانات فقط، تصبح قدرة النموذج على التنبؤ بدقة محدودة للغاية. فالمشاريع تتطلب بيانات تدريب كافية لتنقيح النتائج بالكامل وإزالة التحيزات منها. وخلاف ذلك، يشبه الأمر قيادة السيارة إلى وجهة ما مع بعض الخطوات المخطط لها وحسب.
  • البيانات رديئة الجودة: في حين أن البيانات غير المتوازنة تخلق تحيزات في التنبؤات والنتائج، فإن البيانات رديئة الجودة تؤدي إلى عدم الدقة بشكل عام. يُعد فحص مصادر الجودة خطوة أولى أساسية.

2. التحديات المرتبطة بالخوارزميات

إذا كانت مجموعات بيانات التدريب هي أساس نموذج الذكاء الاصطناعي، فإن الخوارزمية تمثل الهيكل الرئيسي له. وللحصول على نتائج دقيقة باستمرار من نموذج الذكاء الاصطناعي، يجب على المطورين صياغة الخوارزمية وتدريبها بعناية لضمان ملاءمة احتياجات المشروع.

  • اختيار الخوارزمية المناسبة: ما الخوارزمية المناسبة لمشروعك؟ تتوفر مجموعة من خوارزميات الذكاء الاصطناعي كنقاط بداية، ولكل منها نقاط قوتها وضعفها. فعلى سبيل المثال، يمكن لخوارزميات logistic regression دفع المشاريع إلى الأمام بسرعة، ولكنها توفر نتائج ثنائية فقط. يستخدم التوازن الصحيح بين النطاق والنتائج والموارد كل العوامل لتحديد أفضل خيار لمشروعك.
  • التجهيز الزائد: يحدث التجهيز الزائد عندما يصبح نموذج الذكاء الاصطناعي مرتبطاً للغاية بنتيجة محددة، ما يؤدي إلى فقدان نتائج أخرى يجب أن تكون ضمن النطاق. وتحدث هذه الحالات لعدة أسباب، بما في ذلك العدد القليل للغاية من مجموعات بيانات التدريب ومجموعات بيانات التدريب المتجانسة والنماذج المعقدة للغاية التي تؤدي إلى سوء الفهم و"ضوضاء البيانات".
  • التجهيز الناقص: يتم التجهيز الناقص عندما يتطلب نموذج الذكاء الاصطناعي مزيدًا من التدريب وعندما يقدم نتائج دقيقة فقط في ظروف محدودة للغاية. ومن الأمثلة الشائعة على التجهيز الناقص عندما يعمل النموذج بشكل جيد مع مجموعات بيانات التدريب الأولية، ولكنه يفشل مع كل من التحقق الإضافي وبيانات العالم الحقيقي. يحدث التجهيز الناقص غالبًا عندما يكون النموذج بسيطًا للغاية بالنسبة لأهداف المشروع أو حين تفشل الفرق في تنظيف مجموعات بيانات التدريب بشكل صحيح قبل الاستخدام.

3. تحديات الأجهزة والبرامج

تواجه أقسام تكنولوجيا المعلومات تحديات الأجهزة والبرامج عند دعم تدريب نموذج الذكاء الاصطناعي. وتتضمن العوائق المحتملة امتلاك ما يكفي من القدرة الحسابية وسعة التخزين وموارد البيانات وأدوات التوافق والتكامل لرؤية مشروع الذكاء الاصطناعي حتى الانتهاء.

وبشكل عام، يتضمن نجاح تدريب نموذج الذكاء الاصطناعي إدارة مجموعات بيانات كبيرة للغاية. وهذا يعني أن أقسام تكنولوجيا المعلومات تحتاج إلى التأكد من أن المدربين لديهم ما يكفي من الموارد لتخزين البيانات والوصول اللازم ونظام إدارة البيانات وأدوات وأطر البرمجيات المتوافقة.

  • موارد الأجهزة: للتعامل مع معالجة وتحليل مجموعات البيانات الكبيرة - وخاصة بالنسبة للنماذج المعقدة للغاية مثل النماذج الخاصة بـ البحث الطبي - يجب على تكنولوجيا المعلومات تأمين ما يكفي من الخوادم وأنظمة التخزين عالية الأداء. يتطلب تدريب نماذج الذكاء الاصطناعي قوة حوسبية كبيرة، ولهذا تحتاج المؤسسات إلى ضمان توافق نطاق المشروع مع الموارد المتاحة.
  • اعتبارات البرامج: تحتاج مشروعات تدريب الذكاء الاصطناعي إلى دمج عدد من أدوات البرامج المتخصصة وأطر العمل والأنظمة، سواء كانت المصدر أو الهدف. وهذا يجعل التحقق من التوافق جزءًا أساسيًا من الأساس الأولي للمشروع لأن دمج الأدوات المتخصصة مع أنظمة تكنولوجيا المعلومات الحالية قد يكون مهمة معقدة.

4. التحديات التي تواجه توظيف المواهب الماهرة

يتطلب الأمر أشخاصًا ذوي مجموعات مهارات متخصصة عبر تخصصات تقنية مختلفة لتطوير تدريب نموذج الذكاء الاصطناعي وإدارته وتكراره. ويمكن أن يعرقل نقص الخبرة في أي مجال عملية التدريب بسهولة، ما يؤدي في نهاية المطاف إلى إعادة التشغيل بالكامل للمشروع.

  • الطلب على مواهب الذكاء الاصطناعي: لتجميع فريق فائق الجودة من المطورين وعلماء البيانات، ستحتاج إلى التوظيف بشكل حكيم. ورغم هذا، فإن مهارات الذكاء الاصطناعي والتعلم الآلي سلعة تتهافت عليها الشركات، ما يعني أن توظيف الأشخاص المناسبين قد يجبر المؤسسات على الدخول في عملية توظيف تنافسية للغاية. وبالتالي، يجب على أصحاب العمل التحرك بسرعة عند تحديد شخص مؤهل ومواكبة حالة الطلب في السوق. لجذب أفضل المواهب، أظهر التزامك بالتكنولوجيا من خلال إنشاء مركز تميز للذكاء الاصطناعي على سبيل المثال.
  • نقص أخصائي الذكاء الاصطناعي المدربين: إذا بدأت المؤسسة مشروع ذكاء اصطناعي مع فريق تطوير قليل العدد، فقد ينتهي الأمر بالمبادرة إلى أن تكون غير دقيقة أو متحيزة بشكل كبير - حتى لو اكتمل المشروع. والاستمرار في ظل عدم وجود الأخصائيين المدربين يضيع الوقت والمال، ولهذا كن على استعداد للاستثمار في كل من المواهب والتكنولوجيا.

5. التحديات التي تواجه إدارة مشروعات الذكاء الاصطناعي

يمكن أن تكون مشروعات الذكاء الاصطناعي للمؤسسات مكلفة وتحتاج إلى كثير من الموارد. وبعيدًا عن المخاوف المباشرة لتطوير النماذج ومعالجة مصادر البيانات وتدريب نماذج الذكاء الاصطناعي، تتطلب الإدارة توازنًا دقيقًا بين الإشراف المالي والتكنولوجي والجدولة.

  • فجوات الاتصال: تتطلب الإدارة الفعالة للمشروعات لأي مجال اتصالاً قويًا، ولكن يجب على مديري مشروعات الذكاء الاصطناعي التفاعل مع العديد من الفرق، بما في ذلك تكنولوجيا المعلومات والفرق القانونية والمالية، إلى جانب المستخدمين النهائيين للمشروع. ويمكن أن تؤدي فجوات الاتصال إلى حدوث مشاكل لها تأثيرات مضاعفة وتكلف المؤسسة الدقة أو الوقت أو المال أو كل هذه الأمور.
  • التوقعات الخاطئة: كونت الثقافة الشعبية توقعات كبيرة تتعلق بما يمكن للذكاء الاصطناعي فعله. ويتطلب تصويب هذه التوقعات اتصالًا فعالًا من قادة الفريق لتوضيح غرض مشروع الذكاء الاصطناعي وأهدافه وقدراته. بدون هذا، قد لا يفهم المستخدمون الجوانب العملية للمشروع أو حدوده.

6. تحديات إدارة البيانات

في سياق تدريب الذكاء الاصطناعي، يتم تطبيق عناصر مختلفة من أمان البيانات في كل مرحلة. وبشكل جماعي، يخلق هذا سلسلة من التحديات تندرج تحت مظلة إدارة البيانات.

  • الوصول إلى البيانات وملكيتها: من لديه حق الوصول إلى بيانات التدريب؟ من يستطيع رؤية نتائج التدريب؟ من يقوم بمعالجة العملية وحفظها وإدارتها؟ يجب النظر في كل هذه الأسئلة. بدون الإستراتيجيات السليمة لإدارة البيانات مثل استخدام الوصول القائم على الأدوار، يمكن للأمور اللوجستية في المشروع أن تسبب لك مشاكل في أصغر الخطوات - وقد تفتح هذه المشاكل الباب أمام المشاكل الأمنية.
  • خصوصية البيانات وأمانها: قد تحتوي مجموعات بيانات التدريب على بيانات حساسة، بما في ذلك بيانات التعريف الشخصية والتفاصيل المالية وخطط الشركة الحساسة. يمكن أن يتضمن ضمان الخصوصية التشفير و/أو التنظيف في كل من بيانات التدريب .وبيانات المخرجات. بالإضافة إلى ذلك، تنطبق المخاوف القياسية المتعلقة بالأمن السيبراني على نموذج الذكاء الاصطناعي أثناء تدريبه ونشره، لا سيما عندما يتضمن المشروع موارد عامة أو خارجية.

التغلب على تحديات تدريب نموذج الذكاء الاصطناعي

خلال عملية تدريب نموذج الذكاء الاصطناعي، قد تظهر التحديات من جميع الجوانب. ويمكن أن تجعل المشكلات الفنية التي تشمل موارد الأجهزة أو التطبيقات العملية للخوارزميات أو مجموعات البيانات المطورين يتساءلون: "كيف سننفذ هذا على أرض الواقع؟"

يتطلب التغلب على هذه التحديات التخطيط والاستخدام الذكي للموارد، وربما الأهم من ذلك، وهو التواصل المتكرر والكامل والشامل.

كما يمكن أن يساعد الاستخدام الذكي للتكنولوجيا على تحقيق هذا.

الحلول الفنية

يمكن أن تنبع المشاكل الفنية في تدريب نموذج الذكاء الاصطناعي من العديد من الأسباب. وفي بعض الحالات، يتطلب نوع النموذج موارد أكثر مما يمكن أن توفره المؤسسة. في أوقات أخرى، لا يتم إعداد مجموعة بيانات التدريب بشكل صحيح أو قد يحتاج النموذج إلى مجموعات بيانات تدريب أكثر مما هو متاح. يمكن أن تساعد التقنيات الثلاثة التالية على التغلب على التحديات التقنية المشتركة.

  • زيادة البيانات: إذا كان نموذج الذكاء الاصطناعي الخاص بك يحتاج إلى المزيد من مجموعات بيانات التدريب أو تنوعًا أوسعًا في مجموعات البيانات هذه، عندئذٍ لا يزال من غير الممكن الوصول إلى المزيد من الموارد، فقد تتمكن الفرق من إنشاء مجموعاتها الخاصة. وتشير زيادة البيانات إلى عملية زيادة مجموعات بيانات التدريب يدويًا لتوفير المزيد من تدريب النماذج، وأحيانًا مع وضع هدف محدد في الاعتبار.
  • التنظيم: يُعد التجهيز الزائد هو إحدى أكثر المشكلات شيوعًا التي تم اكتشافها في أثناء تدريب نموذج الذكاء الاصطناعي. ويوفر التنظيم تقنيات للتعويض عن هذا ضمن مجموعة بيانات التدريب. ومن خلال التنظيم، تقوم النماذج بالمعايرة لمعالجة التجهيز الزائد من خلال القيام بتحسينات مختلفة تنتج مخرجات أكثر دقة وبساطة. وتشمل تقنيات معالجة التجهيز الزائد الشائعة ridge regression وlasso regression وelastic net.
  • نقل التعلم: يتيح نقل التعلم للمطورين تخطي عدة خطوات باستخدام خوارزمية موجودة كنقطة بداية. ويعتمد نقل التعلم الناجح على عدة عوامل. أولاً، يجب أن يكون ثمة نموذج قابل للتطبيق، ونعني نموذجًا يوضح عملية مماثلة ناجحة مع المرونة الكافية للتكيف مع سياق مشروع جديد. ثانيًا، يجب أن يكون نطاق المشروع وأهدافه قادرين على التكيف مع العمل الحالي.

الحلول التنظيمية

في أي مؤسسة، تتطلب نماذج الذكاء الاصطناعي الناجحة أكثر من الخبرة الفنية. ونظرًا لأنه يمكن لعدة مساهمين المشاركة في عملية التدريب، بما في ذلك الأمور غير الفنية مثل الشؤون المالية والأهداف، فإن نجاح المشروع يعتمد غالبًا على مشاركة المؤسسة بأكملها. وبالتالي، فإن إنشاء جبهة موحدة يشكل تحديًا في حد ذاته.

وفيما يلي بعض الطرق العملية لتحقيق عملية تنظيمية أكثر سلاسة.

  • إنشاء قنوات اتصال واضحة: قد تتطلب مشروعات الذكاء الاصطناعي مجموعات مهارات متنوعة عبر فرق مختلفة. وقد تنشأ التحديات عندما لا تعمل هذه الفرق عادة معًا. وبالتالي، فإن التواصل المفتوح والواضح بخصوص أهداف المشروع ونطاقه وإيقاع عمله يحقق الوحدة ويحد من الفوضى التي يمكن أن تؤدي إلى تكرار العمل أو نسيان الخطوات.
  • تعزيز ثقافة التعاون: تتضمن مشروعات الذكاء الاصطناعي الناجحة العديد من المساهمين المختلفين مع وجهات نظر مختلفة. يتطلب جذب كل هؤلاء الناس إلى وحدة عمل متماسكة وجود ثقافة التعاون. وللحلول الإبداعية، تأكد من إمكانية التعبير عن الآراء الفردية ومناقشتها بطريقة بناءة ومحترمة.
  • تشجيع التعلم المستمر: تطورت قدرات الذكاء الاصطناعي بشكل كبير على مدى السنوات العشرة الماضية، مع تزايد قوة الحوسبة وإمكانية الوصول إلى السحابة بسرعة خاصة. تظهر قدرات ومهارات واستراتيجيات جديدة، ويتطلب البقاء على اطلاع مستمر بالتطورات التعلم المستمر. فيجب على الفرق وضع المستقبل نصب عيونهم حتى خلال المضي قدمًا في المشاريع الحالية.

التغلب على تحديات تدريب نموذج الذكاء الاصطناعي باستخدام Oracle

يمكن لتحديات التدريب على نماذج الذكاء الاصطناعي تشغيل السلسلة من الأمور التقنية إلى التنظيمية؛ لحسن الحظ، ويمكن أن تكون Oracle Cloud Infrastructure (OCI)‎‏ جزءًا من الحل لكل هذا تقريبًا. ويمكن لموارد الحوسبة والتخزين القابلة للتطوير تشغيل التدريب حتى مع مجموعات البيانات الكبيرة والنماذج المعقدة، بينما تساعد أدوات الأمان والحوكمة المتعمقة على تلبية أحدث متطلبات الخصوصية والأمان.

كما تعمل OCI على تسريع التعاون والتواصل بين الأقسام من خلال تمكين مشاركة البيانات وربط مصادرها، وكل ذلك لتوفير المزيد من الشفافية أثناء التطوير. ومن من خلال التغطية الشاملة لخدمات الحوسبة والتخزين والشبكات وقاعدة البيانات والنظام الأساسي، توفر OCI ميزة مرنة وقوية لتدريب نموذج الذكاء الاصطناعي مع تقليل تكاليف المشروع وتكاليف التنظيم.

بالنسبة للمؤسسات التي تستمر في التغلب على التحديات الكامنة في تدريب نماذج الذكاء الاصطناعي، قد تشمل المكاسب مستويات محسنة من الأتمتة والمزايا التنافسية، حتى المنتجات والخدمات الجديدة تمامًا، استنادًا إلى الرؤى التي لن يمكن اكتشافها من دون الذكاء الاصطناعي.

تمتلك فرق تكنولوجيا المعلومات ومديري المشروعات والقيادات التنفيذية الأدوات اللازمة للتغلب على هذه التحديات وغيرها من التحديات التي تنطوي على تدريب نموذج الذكاء الاصطناعي الخاص بكل حالة. ويتطلب الأمر بعض القدر من التفكير الإبداعي.

يؤدي إنشاء مركز تميز للذكاء الاصطناعي قبل بدء التدريب الخاص بالمؤسسة إلى زيادة احتمالات النجاح. وكتابنا الإلكتروني يشرح أسباب هذا ويقدم نصائح عن بناء CoE فعال.

الأسئلة الشائعة عن تحديات تدريب نموذج الذكاء الاصطناعي

كيف يمكن استخدام نقل التعلم لتحسين دقة نماذج الذكاء الاصطناعي؟

يشير نقل التعلم في نماذج الذكاء الاصطناعي إلى عملية استخدام نموذج موجود كنقطة بداية لمشروع جديد. ويعطي هذا المشروعات أسبقية، على الرغم من أن له قيود. ويعمل نقل التعلم بشكل أفضل عندما يعالج النموذج الحالي موقفًا عامًا، مع التعمق في المشروع الجديد بشكل أعمق مع مزيد من التفاصيل. ومع زيادة تطور قدرات الذكاء الاصطناعي، يجب توسيع نطاق نقاط بدء/نهاية نقل التعلم بشكل متزايد.

كيف يمكن للمؤسسات تعزيز ثقافة التعاون بين أعضاء الفريق المشاركين في تدريب نموذج الذكاء الاصطناعي؟

غالبًا ما تحتاج المؤسسات إلى التعاون عبر الفرق مع مجموعات مهارات متنوعة لإكمال مشروعات الذكاء الاصطناعي بنجاح. ولتشجيع التعاون، ينبغي للقادة تشجيع خطوط الاتصال المفتوحة والمدخلات والمناقشات البناءة بين جميع المساهمين وفلسفة التعلم المستمر. ومن خلال التأكيد على كيفية وأسباب "كوننا جميعًا في هذا معًا" مع النظر أيضًا إلى الإمكانات المستقبلية، يمكن للمؤسسة أن تكتسب مزيدًا من التماسك والتواصل العام بين فرقها المختلفة.

كيف يمكن للمؤسسات التغلب على قيود الأجهزة والبرامج خلال تدريب نموذج الذكاء الاصطناعي؟

يمكن للعديد من الحلول المختلفة التغلب على قيود الأجهزة والبرامج. ويمكن تحقيق بعضها داخل المؤسسة، مثل تخصيص موظفين داخليين يتمتعون بمزيد من الخبرة لتقييم النموذج المحدد وتنقيحه. ويمكن أن يكون ثمة مثال آخر في مجموعات بيانات التدريب نفسها - فقد تحتاج إلى التنظيف والإعداد المناسبين للحد من تأثيرها على الموارد. وفي حالات أخرى، يمكن أن يسمح استخدام الموارد الخارجية، مثل النظام الأساسي للبنية التحتية المستندة إلى السحابة، للفرق بالتوسع بسهولة أكبر بمرونة أكبر للتعامل مع متطلبات الحوسبة.