ما هي مستودعات البيانات؟

تعريف مستودع البيانات

مستودع البيانات هو نوع من نظام إدارة البيانات تم تصميمه لتمكين ودعم أنشطة ذكاء الأعمال (BI)، وخاصةً التحليلات. تهدف مستودعات البيانات فقط إلى إجراء الاستعلامات والتحليلات وغالبًا ما تحتوي على أحجام كبيرة من البيانات القديمة. عادةً ما يتم استخلاص البيانات داخل مستودع البيانات من مجموعة واسعة من المصادر، مثل ملفات سجل التطبيقات وتطبيقات المعاملات.

يعمل مستودع البيانات على مركزية ودمج أحجام كبيرة من البيانات من مصادر متعددة. وتسمح الإمكانات التحليلية لمستودع البيانات للمؤسسات باستخلاص رؤى تجارية قيّمة من بياناتها لتحسين عملية اتخاذ القرار. وبمرور الوقت، تنشئ سجلاً قديمًا يكون فائق القيمة لعلماء البيانات ومحللي الأعمال. وبسبب هذه الإمكانات، يمكن اعتبار مخزن البيانات "بمثابة مصدر واحد للحقيقة" في المؤسسة.


فيديو حول مستودع البيانات

 

غالبًا ما يشتمل مستودع البيانات النموذجي على العناصر التالية:

  • قاعدة بيانات ارتباطية لتخزين وإدارة البيانات
  • حل استخراج وتحميل وتحويل (ELT) لإعداد البيانات للتحليلات
  • إمكانات التحليلات الإحصائية، وإعداد التقارير، وجمع البيانات
  • أدوات تحليلات العميل لتصوّر وتقديم البيانات لمستخدمي الأعمال
  • تطبيقات تحليلية أخرى أكثر تطورًا تعمل على إنشاء معلومات قابلة للتنفيذ من خلال تطبيق خوارزميات علوم البيانات والذكاء الاصطناعي (AI) أو الرسم البياني والميزات المكانية التي تتيح المزيد من أنواع تحليل البيانات على نطاق واسع

يمكن للمنظمات أيضًا اختيار حل الجمع بين معالجة المعاملات والتحليلات في الوقت الفعلي عبر مستودعات البيانات وبحيرات البيانات والتعلم الآلي في خدمة MySQL Database واحدة—دون التعقيد والكمون والتكلفة ومخاطر تكرار الاستخراج والتحويل والتحميل (ETL).

مزايا مستودع البيانات

توفّر مستودعات البيانات ميزة شاملة وفريدة من نوعها تتمثل في السماح للمؤسسات بتحليل أحجام كبيرة من البيانات المتغيرة واستخراج قيمة كبيرة منها، وكذلك الاحتفاظ بسجل قديم.

تسمح أربع خصائص فريدة (موضحة من قِبل عالم الكمبيوتر وليام إنمون، الذي يعتبر بمثابة الأب الروحي لمستودع البيانات) لمستودعات البيانات بتقديم هذه الميزة الشاملة. وفقًا لهذا التعريف، تتميز مستودعات البيانات بأنها:

  • موجهة نحو الموضوع. يمكنها تحليل البيانات حول موضوع معين أو مجال وظيفي (مثل المبيعات).
  • متكاملة. تقوم مستودعات البيانات بإنشاء تناسق بين أنواع البيانات المختلفة من مصادر متنوعة.
  • غير متطايرة. بمجرد أن تتواجد البيانات في مستودع بيانات، فإنها تكون ثابتة ولا تتغير.
  • متغيرة زمنيًا. تلجأ تحليلات مستودع البيانات إلى التغيُّر مع مرور الوقت.

سيقوم مخزن البيانات المصمّم بشكل جيد بإجراء الاستعلامات بسرعة كبيرة، وتقديم سرعة نقل بيانات عالية، وتوفير مرونة كافية للمستخدمين النهائيين لتنفيذ "عمليات الإسقاط على الأبعاد" أو تقليل حجم البيانات لإجراء فحص دقيق لتلبية مجموعة متنوعة من المطالب سواء على مستوى عالٍ أو بمستوى جيد جدًا وتفصيلي. كما يُعد مستودع البيانات بمثابة الأساس الوظيفي لبيئات ‬‏‫التحليل الذكي للأعمال (‏BI) الخاصة بالبرامج الوسيطة التي توفّر للمستخدمين تقارير ولوحات معلومات وواجهات أخرى.

بنية مستودع البيانات

يتم تحديد بنية مستودع البيانات حسب الاحتياجات المحددة للمؤسسة. وتتميّز البُنى المشتركة بما يلي:

  • السهولة. تشترك جميع مستودعات البيانات في تصميم أساسي يتم فيه تخزين البيانات الوصفية والبيانات الموجزة والبيانات الخام داخل المستودع المركزي لمستودع البيانات. وتتم تغذية المستودع بمصادر البيانات على أحد الجوانب ويتم الوصول إليه من قِبل المستخدمين لإجراء تحليلات وإعداد التقارير وجمع البيانات على الجانب الآخر.
  • السهولة مع وجود منطقة تشغيل مرحلي. يجب محو البيانات التشغيلية ومعالجتها قبل وضعها في المستودع. وعلى الرغم من أنه يمكن القيام بذلك برمجيًا، فإن العديد من مستودعات البيانات تضيف منطقة تشغيل مرحلي للبيانات قبل أن تدخل المستودع، لتبسيط إعداد البيانات.
  • ذات نظام محوري. تسمح إضافة متاجر البيانات بين المستودع المركزي والمستخدمين للمؤسسة بتخصيص مستودع البيانات الخاص بها لخدمة مختلف أنواع الأعمال. وعندما تكون البيانات جاهزة للاستخدام، يتم نقلها إلى متجر البيانات المناسب.
  • بيئات الاختبار المعزولة. بيئات الاختبار المعزولة هي مناطق خاصة ومحكمة وآمنة تتيح للشركات استكشاف مجموعات البيانات أو طرق تحليل البيانات الجديدة بسرعة وبشكل غير رسمي، بدون الحاجة إلى التكيُّف أو الامتثال مع القواعد والبروتوكول الرسمي لمستودع البيانات.

تطور مستودعات البيانات - بدءًا من تحليلات البيانات إلى الذكاء الاصطناعي والتعلُّم الآلي

عندما ظهرت مستودعات البيانات لأول مرة في أواخر الثمانينيات، كان الغرض منها هو مساعدة تدفق البيانات، بدءًا من أنظمة التشغيل إلى أنظمة دعم اتخاذ القرارات (DSSs). وتطلبت مستودعات البيانات الأولية هذه حجمًا هائلاً من التكرار. وكانت معظم المؤسسات تتضمن بيئات أنظمة دعم اتخاذ القرارات (DSS) متعددة تخدم مختلف مستخدميها. وبالرغم من استخدام بيئات أنظمة دعم اتخاذ القرارات (DSS) للكثير من البيانات نفسها، إلا أن تجميع البيانات ومحوها وتكاملها غالبًا ما كان يتم تكراره في كل بيئة من البيئات.

نظرًا لأن مستودعات البيانات أصبحت أكثر فاعلية، فقد نشأت من مخازن معلومات دعمت الأنظمة الأساسية التقليدية ‏‫للتحليل الذكي للأعمال (‏BI) في بنى تحتية واسعة للتحليلات تدعم مجموعة واسعة من التطبيقات، مثل التحليلات التشغيلية وإدارة الأداء.

تقدمت تكرارات مستودع البيانات بمرور الوقت لتقديم قيمة إضافية إضافية للمؤسسة باستخدام مستودع بيانات الشركة (EDW).

الخطوة الإمكانيات قيمة الأعمال
1 إعداد تقارير عن المعاملات توفير معلومات ارتباطية لإنشاء لقطات لأداء العمل
2 تنفيذ عمليات الإسقاط على الأبعاد‬‏‫، والاستعلام المخصّص، وأدوات ‬‏‫التحليل الذكي للأعمال (‏BI) التوسيع من الإمكانات للحصول على رؤى أعمق وتحليلات أكثر فعالية
3 التنبؤ بالأداء المستقبلي (جمع البيانات) تطوير التصورات وذكاء الأعمال التطلعي
4 التحليل التكتيكي (المكاني، والإحصائيات) توفير سيناريوهات "ماذا لو" للإبلاغ عن القرارات العملية القائمة على تحليلات أكثر شمولية
5 التخزين عدة أشهر أو سنوات من البيانات تخزين البيانات لمدة أسابيع أو أشهر فقط

يتطلب دعم كل خطوة من هذه الخطوات الخمس مجموعة متزايدة ومتنوعة من مجموعات البيانات. تُنشئ الخطوات الثلاث الأخيرة على وجه الخصوص ضرورة لمجموعة أوسع من البيانات وإمكانات تحليلية.

ويعمل الذكاء الاصطناعي والتعلُّم الآلي اليوم على تحويل كل أصول الصناعة والخدمات والمؤسسات - ولا يتم استثناء مستودعات البيانات من ذلك. يؤدي التوسُّع في البيانات الكبيرة وتطبيق التقنيات الرقمية الجديدة إلى إحداث تغيير في متطلبات وإمكانات مستودعات البيانات.

ويعد مستودع البيانات الذاتي هو الخطوة الأخيرة في هذا التطوُّر، حيث يقدم للشركات إمكانية استخراج قيمة أكبر من بياناتها مع تقليل التكاليف وتحسين موثوقية مستودع البيانات وأدائه.

تعرَّف على المزيد حول مستودعات البيانات الذاتية، ثم ابدأ في استخدام مستودع البيانات الذاتي الخاص بك.

مستودعات البيانات، ومتاجر البيانات، ومخازن بيانات التشغيل

على الرغم من أنها تؤدي جميعًا أدوارًا مماثلة، فإن مستودعات البيانات تختلف عن متاجر البيانات ومخازن بيانات التشغيل (ODS). يؤدي متجر البيانات نفس وظائف مستودع البيانات ولكن ضمن نطاق محدود للغاية - عادةً ضمن قسم واحد أو خط أعمال واحد. وهذا بدوره يجعل إنشاء متاجر البيانات أسهل من مستودعات البيانات. ومع ذلك، فإنها تميل إلى تقديم عدم تناسق لأنه قد يكون من الصعب إدارة البيانات والتحكم فيها بشكل موحّد عبر العديد من متاجر البيانات.

تدعم مخازن بيانات التشغيل (ODS) العمليات اليومية فقط، لذلك فإن عرضها للبيانات القديمة محدود للغاية. وعلى الرغم من أنها تعمل جيدًا كمصادر للبيانات الحالية وغالبًا ما تُستخدم في مستودعات البيانات على هذا النحو، فإنها لا تدعم الاستعلامات الثرية القديمة.

ما المقصود بمستودع البيانات السحابي؟

يستخدم مستودع البيانات السحابي السحابة لاستيعاب البيانات وتخزينها من مصادر بيانات مختلفة.

تم بناء مستودعات البيانات الأصلية على خوادم محلية. لا تزال مستودعات البيانات المحلية هذه تتمتع بالعديد من المزايا اليوم. وفي الكثير من الحالات، يمكنهم تقديم تحسين الحوكمة، والأمان، وسيادة البيانات، وزمن انتقال أفضل. ولكن لا تتسم مستودعات البيانات المحلية بالمرونة وتتطلب تنبؤًا معقدًا لتحديد كيفية توسيع نطاق مستودع البيانات لتلبية الاحتياجات المستقبلية. يمكن أن تكون إدارة مستودعات البيانات هذه أيضًا معقدة للغاية.

من ناحية أخرى، تتضمن بعض مزايا مستودعات البيانات السحابية ما يلي:

إن أفضل مستودعات البيانات السحابية تكون مدارة بالكامل وذاتية التوجيه، مما يضمن أنه يمكن حتى للمبتدئين إنشاء مستودع بيانات واستخدامه من خلال بضع نقرات فقط. تتمثل إحدى الطرق السهلة لبدء الترحيل إلى مخزن بيانات سحابية في تشغيل مخزن بيانات السحابة في مكان العمل، خلف جدار حماية مركز البيانات الذي يتوافق مع سيادة البيانات ومتطلبات الأمان.

بالإضافة إلى ذلك، تتبع معظم مستودعات البيانات السحابية نموذج الدفع أولاً بأول، والذي يحقق توفيرًا إضافيًا في التكاليف للعملاء.

ما المقصود بمستودع البيانات الحديث؟

سواء كان مستودع البيانات جزءًا من فِرق تكنولوجيا المعلومات أو هندسة البيانات أو تحليلات الأعمال أو علوم البيانات، تتنوع احتياجات المستخدمين المختلفين عبر المؤسسة لمستودع البيانات.

تلبي بنية البيانات الحديثة هذه الاحتياجات المختلفة من خلال توفير طريقة لإدارة جميع أنواع البيانات وأحمال العمل والتحليل. وتتألف من أنماط بنى مع المكونات الضرورية المتكاملة للعمل معًا بما يتماشى مع أفضل ممارسات المجال. يتضمن مستودع البيانات الحديث:

  • قاعدة بيانات متقاربة تبسط إدارة جميع أنواع البيانات وتوفر طرقًا مختلفة لاستخدام البيانات
  • خدمات استيعاب وتحويل بيانات الخدمة الذاتية
  • دعم SQL والتعلم الآلي والرسم البياني والمعالجة المكانية
  • خيارات تحليلات متعددة تجعل من السهل استخدام البيانات دون نقلها
  • إدارة مؤتمتة لخدمات الإمداد والتوسيع والإدارة البسيطة

يمكن لمستودع البيانات الحديث تبسيط مهام سير عمل البيانات بطريقة لا تستطيع المستودعات الأخرى القيام بها. وهذا يعني أنه يمكن للجميع، بدءًا من المحللين ومهندسي البيانات وحتى علماء البيانات وفرق تكنولوجيا المعلومات، أداء وظائفهم بشكل أكثر فعالية ومتابعة العمل المبتكر الذي يدفع المؤسسة إلى الأمام، دون تأخير وتعقيد لا حصر له.

تصميم مستودع بيانات

عندما تشرع مؤسسة في تصميم مستودع بيانات، يجب أن تبدأ بتحديد متطلباتها التجارية المحددة، والاتفاق على النطاق، وصياغة تصميم مفاهيمي. ويمكن للمؤسسة بعد ذلك إنشاء التصميم المنطقي والمادي لمستودع البيانات. يتضمن التصميم المنطقي العلاقات بين الكائنات، ويتضمن التصميم المادي أفضل طريقة لتخزين الكائنات واستردادها. كما يتضمن التصميم المادي أيضًا عمليات النقل والنسخ الاحتياطي والاسترداد.

يجب أن يعالج أي تصميم لمستودع البيانات ما يلي:

  • محتوى بيانات محدد
  • العلاقات داخل مجموعات البيانات وفيما بينها
  • بيئة الأنظمة التي ستدعم مستودع البيانات
  • أنواع تحويلات البيانات المطلوبة
  • تكرار تحديث البيانات

يرتكز العامل الأساسي في التصميم على احتياجات المستخدمين. ويهتم معظم المستخدمين بإجراء التحليلات والبحث في البيانات بشكل إجمالي، بدلاً من التعامل مع المعاملات الفردية. ومع ذلك، لا يعرف المستخدمون غالبًا ما يريدون حتى تظهر حاجة محددة. وبالتالي، ينبغي أن تتضمن عملية التخطيط استكشافات كافية لتوقُّع الاحتياجات. أخيرًا، يجب أن يتيح تصميم مستودع البيانات مساحة للتوسّع والتطور لمواكبة الاحتياجات المتطورة للمستخدمين.

السحابة ومستودع البيانات

توفّر مستودعات البيانات في السحابة نفس الخصائص والمزايا لمستودعات البيانات المحلية ولكن مع المزايا الإضافية للحوسبة السحابية ― مثل المرونة، والتوسُّع، وسهولة الاستخدام، والأمان، والتكاليف المنخفضة. تسمح مستودعات بيانات السحابة للمؤسسات بالتركيز فقط على استخراج القيمة من بياناتها بدلاً من الاضطرار إلى إنشاء وإدارة البنية التحتية للأجهزة والبرمجيات لدعم مستودع البيانات.

هل أحتاج إلى بحيرة بيانات؟

تستخدم المؤسسات كلاً من بحيرات البيانات ومستودعات البيانات مع الأحجام الكبيرة من البيانات من مصادر مختلفة. ويعتمد اختيار وقت استخدام واحد أو آخر على ما تنوي المؤسسة فعله بالبيانات. فيما يلي وصف لأفضل طريقة لاستخدام كل منها:

  • تعمل بحيرات البيانات على تخزين عدد كبير من البيانات المتباينة وغير المرشحة لاستخدامها لاحقًا لغرض معين. يتم تحصيل البيانات من تطبيقات خط الأعمال، وتطبيقات الأجهزة المحمولة، والوسائط الاجتماعية، وأجهزة إنترنت الأشياء (IoT)، وغيرها، كبيانات خام في بحيرة بيانات. يتم استخلاص بنية مجموعات البيانات المختلفة وتكاملها واختيارها وتنسيقها في وقت التحليلات من قِبل الشخص الذي يجري التحليلات. عندما تحتاج المؤسسات إلى تخزين منخفض التكلفة للبيانات غير المنظمة وغير المنسقة من مصادر متعددة، والتي تعتزم استخدامها لغرض معين في المستقبل، فقد تكون بحيرة البيانات هي الاختيار الصحيح.
  • تهدف مستودعات البيانات بشكل خاص إلى تحليل البيانات. يتم إجراء المعالجة التحليلية داخل مخزن البيانات على البيانات التي تم تجهيزها للتحليلات - التي تم جمعها ووضعها في السياق وتحويلها - بهدف إنشاء رؤى قائمة على التحليلات. كما أن مستودعات البيانات بارعة أيضًا في التعامل مع أحجام كبيرة من البيانات من مصادر مختلفة. عندما تحتاج المؤسسات إلى تحليلات بيانات متقدمة أو تحليلات تعتمد على البيانات القديمة من مصادر متعددة عبر المؤسسة، فمن المحتمل أن يكون مستودع البيانات هو الخيار الصحيح.

لماذا لا يمكن إجراء تحليلات مقابل بيئة OLTP الخاصة بك؟

مستودعات البيانات هي بيئات ارتباطية تُستخدم لتحليلات البيانات، خاصةً تحليلات البيانات القديمة. تستخدم المؤسسات مستودعات البيانات لاكتشاف الأنماط والعلاقات في بياناتها التي تتطور بمرور الوقت.

في المقابل، تُستخدم بيئات المعاملات لمعالجة المعاملات بشكل مستمر وتُستخدم بشكل شائع لإدخال الأوامر والمعاملات المالية ومعاملات البيع بالتجزئة. ولا تعتمد هذه البيئات على البيانات القديمة؛ في الواقع، غالبًا ما يتم أرشفة البيانات القديمة، في بيئات OLTP، أو حذفها ببساطة لتحسين الأداء.

وتختلف مستودعات البيانات وأنظمة OLTP اختلافًا كبيرًا.

مستودع البيانات نظام OLTP
عبء العمل استيعاب الاستعلامات المخصّصة وتحليلات البيانات دعم عمليات محددة مسبقًا فقط
تعديلات البيانات إجراء تحديثات تلقائيًا على أساس منتظم إجراء تحديثات من قِبل المستخدمين لإصدار بيانات فردية
تصميم المخططات استخدام مخططات مُعاد تنظيمها جزئيًا لتحسين الأداء استخدام مخططات تم تنظيمها تمامًا لضمان اتساق البيانات
مسح البيانات يشمل آلاف الصفوف إلى الملايين منها يصل فقط إلى عدد قليل من السجلات في المرة الواحدة
البيانات القديمة التخزين عدة أشهر أو سنوات من البيانات تخزين البيانات لمدة أسابيع أو أشهر فقط

النشر بدون تعقيد: مستودع البيانات الذاتي

يتمثل أحدث تكرار لمستودع البيانات في مستودع البيانات الذاتي، والذي يعتمد على الذكاء الاصطناعي والتعلُّم الآلي للحد من المهام اليدوية وتبسيط عملية الإعداد والنشر وإدارة البيانات. لا يتطلب مستودع البيانات الذاتي كخدمة في السحابة أي إدارة لقواعد البيانات أو تهيئة الأجهزة أو الإدارة أو تثبيت البرمجيات من قِبل الأشخاص.

يتم إنشاء مستودع البيانات والنسخ الاحتياطي وتصحيح قاعدة البيانات وترقيتها، وكذلك توسيع نطاق قاعدة البيانات أو تقليله تلقائيًا - مع توفُّر نفس المرونة، وقابلية التطوير، وسهولة الاستخدام، وخفض التكاليف التي توفرها الأنظمة الأساسية السحابية. يحد Oracle Autonomous Data Warehouse من التعقيد ويوفّر سرعة النشر ويحرر الموارد، حتى تتمكن المؤسسات من التركيز على الأنشطة التي تضيف قيمة للأعمال.

مستودع البيانات الذاتية من Oracle

Oracle Autonomous Data Warehouse عبارة عن مستودع بيانات سهل الاستخدام ومستقل تمامًا يسمح بالتوسُّع بشكل مرن، ويقدم أداءً سريعًا للاستعلام ولا يتطلب إدارة قاعدة البيانات. ويتسم الإعداد لخدمة Oracle Autonomous Data Warehouse بالبساطة والسرعة الشديدة.

سبب اختيار Oracle Autonomous Data Warehouse بدلًا من Snowflake

  • الأتمتة. يعمل مخزن البيانات الوحيد على أتمتة إدارة قاعدة البيانات بالكامل.
  • سهولة الاستخدام. حل Autonomous Data Warehouse أسهل في النشر والإدارة من خلال إمكانات مُدمجة تعمل على إزالة الحاجة إلى خدمات مستقلة إضافية.
  • تكلفة الحل. يتمتع مخزن البيانات الحديث والميزة المحسنة لدينا بتكاليف مماثلة لمتطلبات أحمال العمل المماثلة.
  • أمان البيانات. نوفر بروتوكولات أمان مدمجة أقوى تحمي بياناتك من التهديدات الإلكترونية.
  • إدارة البيانات. تُضفي منصة مستودع البيانات لدينا سلاسة على المؤسسات لإدارة احتياجات سيادة البيانات.