يتم تعريف قاعدة بيانات الرسم البياني على أنها نظام أساسي متخصص أحادي الغرض لإنشاء الرسوم البيانية ومعالجتها. تحتوي الرسوم البيانية على نقاط توصيل وحواف وخصائص، وكلها تُستخدم لتمثيل البيانات وتخزينها بطريقة لا تكون قواعد البيانات العلائقية مجهزة للقيام بها.
تُعد تحليلات الرسوم البيانية مصطلحًا آخر شائع الاستخدام، وتشير بشكل خاص إلى عملية تحليل البيانات بتنسيق رسم بياني باستخدام نقاط البيانات كنقاط توصيل وعلاقات كحواف. تتطلب تحليلات الرسم البياني قاعدة بيانات يمكنها دعم صيغ الرسم البياني؛ وقد تكون قاعدة بيانات رسم بياني مخصصة، أو قاعدة بيانات متقاربة تدعم نماذج بيانات متعددة، بما في ذلك الرسم البياني.
هناك نموذجان شائعان لقواعد بيانات الرسم البياني: الرسوم البيانية للخصائص والرسوم البيانية RDF. يركز الرسم البياني للخاصية على التحليلات والاستعلام، بينما يركز الرسم البياني لـ RDF على تكامل البيانات. يتكون كلا النوعين من الرسوم البيانية من مجموعة من النقاط (الإشارات) والاتصالات بين تلك النقاط (الحواف). ولكن هناك اختلافات أيضًا.
تُستخدم الرسوم البيانية للخصائص في إنشاء نماذج للعلاقات بين البيانات، كما أنها تتيح الاستعلام وتحليلات البيانات استنادًا إلى هذه العلاقات. يحتوي الرسم البياني للخاصية على رؤوس يمكن أن تحتوي على معلومات تفصيلية حول الموضوع والحواف التي تشير إلى العلاقة بين الرؤوس. يمكن أن يكون للرؤوس والحواف سمات مرتبطة بها، تسمى الخصائص.
في هذا المثال، يتم تمثيل مجموعة من الزملاء والعلاقات الخاصة بهم كرسم بياني للخاصية.
نظرًا لتعدد الاستخدامات، يتم استخدام الرسوم البيانية العقارية في مجموعة واسعة من الصناعات والقطاعات، مثل التمويل والتصنيع والسلامة العامة والتجزئة وغيرها الكثير.
تتطابق الرسوم البيانية RDF (RDF تمثل إطار وصف المورد) مع مجموعة من معايير W3C (اتحاد الويب العالمي) المصممة لتمثيل البيانات وهي الأفضل لتمثيل بيانات التعريف المعقدة والبيانات الرئيسية. وتُستخدم غالبًا في البيانات المرتبطة وتكامل البيانات والرسوم البيانية للمعرفة. كما يمكن أن تمثل مفاهيم معقدة في مجال ما، أو توفر دلالات غنية وتستنتج البيانات.
في نموذج RDF يتم تمثيل الجملة بثلاثة عناصر: رأسين متصلين بحافة تعكس موضوع الجملة ومسندها وموضوعها-يعرف هذا بثلاثة أضعاف RDF. يتم تعريف كل رأس وحافة باستخدام معرف URI فريد أو معرف مورد فريد. يوفر نموذج RDF طريقة لنشر البيانات بتنسيق قياسي باستخدام دلالات محددة بشكل جيد، مما يتيح تبادل المعلومات. وقد اعتمدت وكالات الإحصاءات الحكومية وشركات الأدوية ومنظمات الرعاية الصحية الرسوم البيانية لـ RDF على نطاق واسع.
توفر الرسوم البيانية وقواعد بيانات الرسوم البيانية نماذج رسوم بيانية لتمثيل العلاقات في البيانات. وهي تتيح للمستخدمين إجراء "استعلامات اجتيازية" استنادًا إلى الاتصالات وتطبيق خوارزميات الرسوم البيانية للعثور على الأنماط والمسارات والمجتمعات المحلية وعوامل التأثير ونقاط الفشل المفردة والعلاقات الأخرى، مما يتيح تحليلًا أكثر كفاءة على نطاق واسع مقابل كميات هائلة من البيانات. وتكمن قوة الرسوم البيانية في التحليلات والرؤى التي تقدمها وقدرتها على ربط مصادر البيانات المختلفة.
عندما يتعلق الأمر بتحليل الرسوم البيانية، تستكشف الخوارزميات المسارات والمسافة بين الرؤوس وأهمية الرؤوس وتجميع الرؤوس. على سبيل المثال، لتحديد خوارزميات الأهمية غالبًا ما تنظر إلى الحواف الواردة، وأهمية الرؤوس المجاورة، ومؤشرات أخرى.
خوارزميات الرسم البياني - العمليات المصممة خصيصًا لتحليل العلاقات والسلوكيات بين البيانات في الرسوم البيانية - تجعل من الممكن فهم الأشياء التي يصعب رؤيتها مع الأساليب الأخرى. عندما يتعلق الأمر بتحليل الرسوم البيانية، تستكشف الخوارزميات المسارات والمسافة بين الرؤوس وأهمية الرؤوس وتجميع الرؤوس. غالبًا ما تنظر الخوارزميات إلى الحواف الواردة وأهمية الرؤوس المجاورة والمؤشرات الأخرى للمساعدة في تحديد الأهمية. على سبيل المثال، يمكن لخوارزميات الرسم البياني تحديد العنصر أو الفرد الأكثر اتصالًا بالآخرين في الشبكات الاجتماعية أو عمليات الأعمال. يمكن للخوارزميات تحديد المجتمعات والحالات الشاذة والأنماط العامة والمسارات التي تربط الأفراد أو المعاملات المرتبطة.
نظرًا لأن قواعد بيانات الرسوم البيانية تخزن العلاقات بشكل صريح، يمكن تشغيل الاستعلامات والخوارزميات التي تستخدم الاتصال بين الرؤوس في ثوانٍ فرعية بدلاً من ساعات أو أيام. لا يحتاج المستخدمون إلى تنفيذ روابط لا حصر لها، ويمكن استخدام البيانات بسهولة أكبر للتحليل والتعلم الآلي لاكتشاف المزيد حول العالم من حولنا.
يوفر تنسيق الرسم البياني نظامًا أساسيًا أكثر مرونة للعثور على الاتصالات البعيدة أو تحليل البيانات استنادًا إلى أشياء مثل قوة العلاقة أو جودتها. تتيح لك الرسوم البيانية استكشاف واكتشاف الاتصالات والأنماط في الشبكات الاجتماعية، وIoT، والبيانات الكبيرة، ومستودعات البيانات، وكذلك بيانات المعاملات المعقدة لحالات استخدام الأعمال المتعددة بما في ذلك الكشف عن الاحتيال في الخدمات المصرفية، واكتشاف الاتصالات في الشبكات الاجتماعية، والعميل بطريقة شاملة. واليوم، يزداد استخدام قواعد البيانات البيانية كجزء من علوم البيانات كوسيلة لجعل الاتصالات في العلاقات أكثر وضوحًا.
نظرًا لأن قواعد بيانات الرسوم البيانية تخزن العلاقات بشكل صريح، يمكن تشغيل الاستعلامات والخوارزميات التي تستخدم الاتصال بين الرؤوس في ثوانٍ فرعية بدلاً من ساعات أو أيام. لا يحتاج المستخدمون إلى تنفيذ روابط لا حصر لها، ويمكن استخدام البيانات بسهولة أكبر للتحليل والتعلم الآلي لاكتشاف المزيد حول العالم من حولنا.
تعد قواعد بيانات الرسوم البيانية أداة مرنة للغاية وقوية للغاية. وبسبب تنسيق الرسم البياني، يمكن تحديد العلاقات المعقدة للحصول على رؤى أعمق بجهد أقل بكثير. تقوم قواعد بيانات الرسم البياني عادة بتشغيل الاستعلامات بلغات مثل لغة استعلام الرسم البياني للخاصية (PGQL). يوضح المثال أدناه نفس الاستعلام في PGQL وSQL.
كما هو موضح في المثال أعلاه، تعتبر تعليمات PGQL البرمجية أبسط وأكثر كفاءة. نظرًا لأن الرسوم البيانية تؤكد على العلاقات بين البيانات، فهي مثالية للعديد من أنواع التحليلات المختلفة. على وجه الخصوص، تتفوق قواعد بيانات الرسوم البيانية على:
مثال بسيط على قواعد بيانات الرسوم البيانية في العمل هو الصورة أدناه، والتي تظهر تمثيلاً مرئيًا لعبة الحزب الشعبية "ست درجات كيفن بيكون". بالنسبة لهؤلاء الجدد، تتضمن هذه اللعبة إقامة روابط بين كيفن بيكون وممثل آخر قائم على سلسلة من الأفلام المتبادلة. وهذا التركيز على العلاقات يجعله الطريقة المثالية لإظهار تحليلات الرسوم البيانية.
تخيل مجموعة بيانات تضم فئتين من العقد: كل فيلم مصنوع على الإطلاق وكل ممثل موجود في تلك الأفلام. ثم، باستخدام الرسم البياني، نقوم بتشغيل استعلام يطلب توصيل Kevin Bacon بأيقونة Muppet Miss Piggy. وستكون النتيجة على النحو التالي:
في هذا المثال، العُقد المتوفرة (التقارير) هي كلاً من الممثلين والأفلام والعلاقات (التجمعات) هي حالة "acted in". ومن هنا، يُرجع الاستعلام النتائج التالية:
يمكن لقواعد بيانات الرسم البياني الاستعلام عن العديد من العلاقات المختلفة لمثال كيفن بيكون هذا، مثل:
وهذا بالطبع مثال مضحك أكثر من معظم استخدامات تحليلات الرسوم البيانية. ولكن هذا النهج يعمل في جميع البيانات الكبيرة تقريبًا - أي موقف تظهر فيه أعداد كبيرة من السجلات اتصالًا طبيعيًا مع بعضها البعض. تتمثل بعض الطرق الأكثر شيوعًا لاستخدام تحليلات الرسوم البيانية في تحليل الشبكات الاجتماعية وشبكات الاتصال وحركة استخدام موقع الويب وبيانات الطرق في العالم الحقيقي والمعاملات والحسابات المالية.
ومن المفهوم أن غسل الأموال أمر بسيط. يتم تمرير الأموال القذرة لمزجها مع الأموال المشروعة ثم تحويلها إلى أصول صلبة. هذا هو نوع العملية التي تم استخدامها في تحليل أوراق بنما.
وبشكل أكثر تحديدًا، ينطوي تحويل الأموال الدائري على مجرم يرسل مبالغ كبيرة من الأموال التي تم الحصول عليها بشكل احتيالي إلى نفسه - لكنه يخفيها من خلال سلسلة طويلة ومعقدة من التحويلات الصالحة بين الحسابات "العادية". هذه الحسابات "العادية" هي في الواقع حسابات تم إنشاؤها باستخدام الهويات الاصطناعية. وهي تتشارك عادةً بعض المعلومات المشابهة لأنها يتم توليدها من الهويات المسروقة (عناوين البريد الإلكتروني والعناوين وما إلى ذلك) وهذه المعلومات ذات الصلة هي التي تجعل تحليل الرسم البياني مناسبًا جدًا لجعلها تكشف عن أصولها الاحتيالية.
لجعل الكشف عن الاحتيال أكثر بساطة، يمكن للمستخدمين إنشاء رسم بياني من المعاملات بين الكيانات والكيانات التي تشترك في بعض المعلومات، بما في ذلك عناوين البريد الإلكتروني وكلمات المرور والعناوين والمزيد. بمجرد إنشاء رسم بياني، يؤدي تشغيل استعلام بسيط إلى العثور على جميع العملاء الذين لديهم معلومات مماثلة، والكشف عن الحسابات التي ترسل الأموال لبعضهم البعض.
يمكن استخدام قواعد بيانات الرسم البياني في العديد من السيناريوهات المختلفة، ولكن يُستخدم عادةً لتحليل الشبكات الاجتماعية. في الواقع، تجعل الشبكات الاجتماعية حالة الاستخدام المثالية لأنها تنطوي على حجم كبير من نقاط التوصيل (حسابات المستخدمين) والاتصالات متعددة الأبعاد (التفاعلات في العديد من الاتجاهات المختلفة). يمكن أن يحدد تحليل الرسم البياني للشبكة الاجتماعية ما يلي:
ومع ذلك، تكون هذه المعلومات عديمة الفائدة إذا تم انحرافها بشكل غير طبيعي من قبل الروبوتات. لحسن الحظ، يمكن أن توفر تحليلات الرسوم البيانية وسيلة ممتازة لتحديد الروبوتات وتصفيتها.
في حالة استخدام واقعية، استخدم فريق Oracle Oracle Marketing Cloud لتقييم إعلانات الوسائط الاجتماعية وجذبها — على وجه التحديد، لتحديد حسابات الروبوتات المزيفة التي تؤدي إلى تحريف البيانات. ويتضمن السلوك الأكثر شيوعًا لهذه الروبوتات إعادة تغريد الحسابات المستهدفة، وبالتالي تضخيم شعبيتها بشكل مصطنع. يسمح تحليل النمط البسيط بإلقاء نظرة باستخدام عدد مرات إعادة التغريد وكثافة الاتصالات بالجوار. أظهرت الحسابات الشائعة بطبيعة الحال علاقات مختلفة مع الأجهزة المجاورة مقارنة بالحسابات القائمة على الروبوتات.
تعرض هذه الصورة الحسابات الشائعة بشكل طبيعي.
وتعرض هذه الصورة سلوك حساب يستند إلى الروبوتات.
يستخدم المفتاح هنا قوة تحليلات الرسم البياني لتحديد نمط طبيعي مقابل نمط روبوت. من هناك، من السهل تصفية تلك الحسابات، على الرغم من أنه من الممكن أيضًا التعمق في دراسة العلاقة بين الروبوتات والحسابات المعاد تغريدها.
تبذل شبكات التواصل الاجتماعي قصارى جهدها للقضاء على حسابات الروبوتات، لأنها تؤثر في تجربة قاعدة المستخدمين العامة. للتحقق من دقة عملية اكتشاف الروبوتات هذه، تم فحص الحسابات المميزة بعلامات بعد شهر. وكانت النتائج كما يلي:
أظهرت هذه النسبة العالية للغاية من الحسابات التي تمت معاقبتها (91.2%) دقة كل من تحديد النمط وعملية التطهير. كان ذلك سيستغرق وقتًا أطول بكثير في قاعدة البيانات الجدولية القياسية، ولكن مع تحليلات الرسوم البيانية، من الممكن تحديد الأنماط المعقدة بسرعة.
أصبحت قواعد بيانات الرسوم البيانية أداة فعالة في صناعة التمويل كوسيلة للكشف عن الاحتيال. وعلى الرغم من التقدم المحرز في تكنولوجيا مكافحة الاحتيال، مثل استخدام الرقائق المضمنة في البطاقات، يمكن أن يحدث الاحتيال بعدد من الطرق. يمكن لأجهزة نسخ البطاقات سرقة التفاصيل من شرائط مغناطيسية - وهي تقنية شائعة الاستخدام في المواقع التي لم تقم بتركيب قارئات شريحة حتى الآن. بمجرد تخزين هذه التفاصيل، يمكن تحميلها على بطاقة مزيفة لإجراء عمليات الشراء أو سحب الأموال.
وكوسيلة للكشف عن الاحتيال، غالبًا ما يكون تحديد الأنماط هو خط الدفاع الأول. تستند أنماط الشراء المتوقعة على الموقع والتكرار وأنواع المتاجر وغيرها من الأشياء التي تناسب ملف تعريف المستخدم. عندما يبدو شيء ما شاذًا تمامًا - على سبيل المثال، فإن الشخص الذي يبقى داخل منطقة خليج سان فرانسيسكو في معظم الوقت يقوم فجأة بعمليات شراء في وقت متأخر من الليل في فلوريدا - يشير إلى أنه احتمالي الاحتيال.
تم تبسيط قوة الحوسبة اللازمة لذلك بشكل كبير باستخدام تحليلات الرسوم البيانية. تتفوق تحليلات الرسم البياني في تأسيس الأنماط بين نقاط التوصيل - في هذه الحالة، يتم تعريف فئات نقاط التوصيل على أنها حسابات (أصحاب البطاقات) ومواقع الشراء وفئة الشراء والمعاملات والأجهزة الطرفية. من السهل تحديد أنماط السلوك الطبيعي، على سبيل المثال، في شهر معين، يمكن للشخص:
تتم معالجة اكتشاف الاحتيال عادةً من خلال التعلم الآلي، ولكن يمكن أن تكمل تحليلات الرسم البياني هذا الجهد لإنشاء عملية أكثر دقة وكفاءة. وبفضل التركيز على العلاقات، أصبحت النتائج جهات تنبؤية فعالة في تحديد السجلات الاحتيالية ووضع علامات عليها.
تطورت قواعد بيانات الرسوم البيانية وتقنيات الرسوم البيانية مع زيادة قوة الحوسبة والبيانات الكبيرة على مدار العقد الماضي. في الواقع، أصبح من الواضح بشكل متزايد أنها ستصبح الأداة القياسية لتحليل عالم جديد شجاع من علاقات البيانات المعقدة. مع استمرار الشركات والمؤسسات في دفع إمكانات البيانات الكبيرة والتحليلات، تجعل القدرة على استخلاص الرؤى بطرق متزايدة التعقيد قواعد بيانات الرسوم البيانية أمرًا ضروريًا لتلبية احتياجات اليوم ونجاحات الغد.
تسهل Oracle اعتماد تقنيات الرسوم البيانية. تتضمن Oracle Database وOracle Autonomous Database محرك تحليلات الرسم البياني وقاعدة بيانات الرسم البياني بحيث يمكن للمستخدمين اكتشاف المزيد من الرؤى في بياناتهم باستخدام قوة خوارزميات الرسم البياني واستعلامات مطابقة الأنماط والتمثيل المرئي. تعد الرسوم البيانية جزءًا من قاعدة البيانات المتقاربة من Oracle، والتي تدعم المتطلبات متعددة النماذج ومتعددة أحمال العمل ومتعددة المؤسسات - كل ذلك في محرك قاعدة بيانات واحد.
على الرغم من أن جميع قواعد بيانات الرسوم البيانية تدعي أنها عالية الأداء، إلا أن عروض الرسوم البيانية من Oracle تؤدي كل من أداء الاستعلام والخوارزميات، بالإضافة إلى دمجها بإحكام مع قاعدة بيانات Oracle. يسهل ذلك على المطورين إضافة تحليلات الرسوم البيانية إلى التطبيقات الحالية والاستفادة من قابلية التوسع والاتساق والاسترداد والتحكم في الوصول والأمان التي توفرها قاعدة البيانات بشكل افتراضي.