آلان زيتشيك | خبير استراتيجي للمحتوى التقني | 19 سبتمبر 2023
يتفوق الذكاء الاصطناعي المبتكر في إنشاء استجابات نصية استنادًا إلى نماذج اللغات الكبيرة (LLM)، إذ يتم تدريب الذكاء الاصطناعي على عدد هائل من نقاط البيانات. إن الخبر السار في أن النص المُنشئ غالبًا ما يكون سهلاً للقراءة ويوفر ردودًا مُفصلة تنطبق على نطاق واسع على الأسئلة المطروحة من البرنامج، وتُسمى غالبًا موجهات.
إن الخبر السيئ في أن المعلومات المُستخدمة لإنشاء الاستجابة تقتصر على المعلومات المستخدمة لتدريب الذكاء الاصطناعي، وتكون غالبًا LLM عام. قد تكون بيانات LLM أسابيع أو شهور أو سنوات قديمة، وقد لا تتضمن روبوت محادثة الذكاء الاصطناعي للمؤسسة معلومات مُحددة حول منتجات أو خدمات المؤسسة. يمكن أن يؤدي ذلك إلى استجابات غير صحيحة تؤدي إلى ضعف الثقة في التكنولوجيا بين العملاء والموظفين.
ويأتي هنا دور الإنشاء المعزز للاستعادة (RAG). يوفر RAG طريقة لتحسين مخرجات LLM مع معلومات مُستهدفة دون تعديل النموذج الأساس نفسه؛ يمكن أن تكون هذه المعلومات المُستهدفة أكثر تحديثًا من LLM كذلك تكون خاصةً بمؤسسة وصناعة معينة. يعني هذا أن نظام الذكاء الاصطناعي المبتكر يمكن أن يوفر إجابات أكثر ملاءمة للسياق للموجهات بالإضافة إلى اعتماد هذه الإجابات على البيانات الحالية للغاية.
استرعى RAG أول مرة إلى انتباه مطوري الذكاء الاصطناعي المبتكر بعد نشر "الإنشاء المعزز للاستعادة لمهام NLP كثيفة المعرفة"، وهي ورقة نشرت عام 2020 من باتريك لويس وفريق في Facebook AI Research. تم تبني مفهوم RAG من العديد من الباحثين الأكاديميين والصناعيين، الذين يرون أنه وسيلة لتحسين قيمة أنظمة الذكاء الاصطناعي المبتكر بشكل كبير.
فكر في دوري رياضي يريد أن يُمكّن المشجعين والوسائط من استخدام المحادثة للوصول إلى بياناته والإجابة على الأسئلة المُتعلقة باللاعبين والفِرق وتاريخ الرياضة وقواعدها والإحصائيات والترتيبات الحالية. يمكن أن يجيب LLM العام على أسئلة حول التاريخ والقواعد أو ربما يصف مَلعب فريق معين. لن تتمكن من مناقشة مبارة الليلة الماضية أو تقديم معلومات حالية حول إصابة رياضي معين لأن LLM لن يكون لديه هذه المعلومات—وبالنظر إلى أن LLM يأخذ قوة حصان حوسبة كبيرة لإعادة التدريب، فليس من الممكن الحفاظ على النموذج الحالي.
بالإضافة إلى LLM الكبير الثابت إلى حد ما، يمتلك الدوري الرياضي أو يمكنه الوصول إلى العديد من مصادر المعلومات الأخرى، بما في ذلك قواعد البيانات ومستودعات البيانات والمستندات التي تحتوي على السيرة الذاتية للاعب وموجزات الأخبار التي تناقش كل لعبة بشكل متعمق. يتيح RAG الذكاء الاصطناعي المبتكر استيعاب هذه المعلومات. يمكن الآن أن توفر المحادثة معلومات أكثر ملاءمة للسياق وأدق في الوقت المناسب.
ببساطة، إن RAG تساعد نماذج LLM على تقديم إجابات أفضل.
النقاط الرئيسة
فكّر في كل المعلومات التي تمتلكها المؤسسة—قواعد البيانات المنظمة، وملفات PDF غير المنظمة والمستندات الأخرى، والمدونات، وموجزات الأخبار، ونصوص المحادثات من جلسات خدمة العملاء السابقة. في RAG، يتم ترجمة هذه الكمية الهائلة من البيانات الديناميكية إلى تنسيق مشترك وتخزينها في مكتبة معرفة يمكن الوصول إليها من نظام الذكاء الاصطناعي المبتكر.
يتم معالجة البيانات الموجودة في مكتبة المعرفة هذه بعد ذلك في تمثيلات رقمية باستخدام نوع خاص من الخوارزميات يسمى نموذج لغة مُضمن وتخزينها في قاعدة بيانات متجهات، والتي يمكن البحث عنها واستخدامها بسرعة لاستعادة المعلومات السياقية الصحيحة.
الآن، دعنا نقول أن أحد المستخدمين النهائيين يرسل إلى نظام الذكاء الاصطناعي المبتكر مطالبة محددة، على سبيل المثال، "أين تلعب مبارة الليلة، ومن هم اللاعبين الذي يبدأون المبارة، وما الذي يقوله الصحفيون عن المباراة؟". يتم تحويل الاستعلام إلى متجه ويُستخدم للاستعلام عن قاعدة بيانات المتجهات التي تستعيد المعلومات ذات الصلة بسياق هذا السؤال. ثم يتم إدخال هذه المعلومات السياقية بالإضافة إلى المطالبة الأصلية في LLM، والتي تنشئ استجابة نصية على أساس كل من المعرفة العامة القديمة إلى حد ما والمعلومات السياقية في الوقت المناسب للغاية.
من المثير للاهتمام أنه في حين أن عملية تدريب LLM العام تستغرق وقتًا طويلاً ومُكلفة، تمثل التحديثات على نموذج RAG العكس تمامًا. يمكن تحميل البيانات الجديدة إلى نموذج اللغة المُضمن وترجمتها إلى موجهات على أساس مستمر ومتزايد. في الواقع، يمكن تغذية الإجابات من نظام الذكاء الاصطناعي المبتكر بأكمله في نموذج RAG، وتحسين أدائه ودقته، لأنه في الواقع، يعرف كيف أجاب بالفعل على سؤال مُماثل.
تتمثل إحدى المزايا الإضافية لـ RAG أنه باستخدام قاعدة البيانات المتجهات، يمكن للذكاء الاصطناعي المبتكر توفير مصدر محدد للبيانات المذكورة في إجابته—وهو شيء لا يمكن لـ LLM فعله. لذلك، إذا كان يوجد عدم دقة في مخرجات الذكاء الاصطناعي، فيمكن تحديد المستند الذي يحتوي على هذه المعلومات الخاطئة وتصحيحها بسرعة، ثم يمكن إدخال المعلومات التي تم تصحيحها في قاعدة بيانات المتجهات.
باختصار، يوفر RAG مقياس الوقت والسياق والدقة المستندة إلى أدلة على الذكاء الاصطناعي المبتكر، ويتجاوز ما يمكن أن يقدمه LLM نفسه.
إن RAG ليست التقنية الوحيدة المستخدمة لتحسين دقة الذكاء الاصطناعي المبتكر القائم على LLM. تقنية أخرى وهي البحث الدلالي، الذي يساعد نظام الذكاء الاصطناعي على تضييق معنى الاستعلام من خلال البحث عن فهم عميق للكلمات والعبارات المُحددة في المطالبة.
يركز البحث التقليدي على الكلمات الرئيسة. على سبيل المثال، قد يبحث استعلام أساس عن أنواع الأشجار الأصلية في فرنسا في قاعدة بيانات نظام الذكاء الاصطناعي باستخدام "الأشجار" و"فرنسا" ككلمات رئيسة ويبحث عن بيانات تحتوي على كلمتين رئيستان—لكن النظام قد لا يفهم معنى الأشجار في فرنسا، وبالتالي؛ قد يستعيد الكثير من المعلومات، القليل جدًا، أو حتى المعلومات الخاطئة. قد يفوت هذا البحث المستند إلى الكلمات الرئيسة أيضًا المعلومات لأن البحث بالكلمة الرئيسة حرفي للغاية: قد يفوت الأشجار الأصلية في نورماندي، على الرغم من أنها موجودة في فرنسا، لأن تلك الكلمة الرئيسة كانت مفقودة.
يتجاوز البحث الدلالي البحث بالكلمة الرئيسة من خلال تحديد معنى الأسئلة والمستندات المصدر واستخدام هذا المعنى لاستعادة نتائج أدق. إن البحث الدلالي جزء لا يتجزأ من RAG.
عندما يريد شخص إجابة فورية على سؤال، يصعب التغلب على الفورية وسهولة استخدام روبوت المحادثة. يتم تدريب معظم الروبوتات على عدد محدود من الأغراض—أي؛ المهام أو النتائج المرغوبة للعميل—وتستجيب لهذه الأغراض. يمكن لإمكانات RAG تحسين الروبوتات الحالية من خلال السماح لنظام الذكاء الاصطناعي بتقديم إجابات بلغة طبيعية للأسئلة غير الموجودة في قائمة الأغراض.
إن نموذج "اطرح سؤالاً واحصل على إجابة" يجعل روبوتات المحادثة حالة استخدام مثالية للذكاء الاصطناعي المبتكر للعديد من الأسباب. تتطلب غالبًا الأسئلة سياقًا مُحددًا لإنشاء إجابة دقيقة، وبالنظر إلى أن توقعات مستخدمي روبوتات المحادثة حول الصلة والدقة تكون غالبًا عالية، تصبح واضحة طريقة تطبيق تقنيات RAG. في الواقع، بالنسبة للعديد من المؤسسات، قد تكون روبوتات المحادثة بالفعل نقطة البداية لاستخدام RAG واستخدام الذكاء الاصطناعي المبتكر.
تتطلب الأسئلة غالبًا سياقًا مُحددًا لتقديم إجابة دقيقة. على سبيل المثال، لا تفيد استعلامات العملاء عن منتج تم تقديمه حديثًا إذا كانت البيانات تتعلق بالنموذج السابق وقد تكون مُضللة في الواقع. ويتوقع المتجول الذي يريد معرفة إذا كانت الحديقة مفتوحة يوم الأحد معلومات دقيقة في الوقت المناسب عن تلك الحديقة المحددة في ذلك التاريخ المحدد.
يمكن استخدام تقنيات RAG لتحسين جودة استجابات نظام الذكاء الاصطناعي المبتكر للمطالبات، بما يتجاوز ما يمكن أن يقدمه LLM وحده. تشمل المزايا ما يلي:
نظرًا إلى أن RAG تقنية جديدة نسبيًا، تم اقتراحها لأول مرة في عام 2020، فلا يزال مطورو الذكاء الاصطناعي يتعلمون طريقة تنفيذ آليات استعادة المعلومات الخاصة بها على أفضل وجه في الذكاء الاصطناعي المبتكر. تتمثل بعض التحديات الرئيسة فيما يلي:
توجد العديد من الأمثلة المحتملة على الذكاء الاصطناعي المعزز بواسطة RAG.
كتبت Cohere، الشركة الرائدة في مجال الذكاء الاصطناعي المبتكر وRAG، عن روبوت محادثة يمكنه توفير معلومات سياقية حول تأجير عناصر العطلات في جزر الكناري، بما في ذلك إجابات قائمة على الحقائق حول إمكانية الوصول إلى الشاطئ ورجال الإنقاذ على الشواطئ القريبة وتوافر ملاعب كرة الطائرة على مسافة قريبة سيرًا.
وصفت Oracle حالات الاستخدام الأخرى لـ RAG، مثل تحليل التقارير المالية والمساعدة في اكتشاف الغاز والنفط ومراجعة الدفاتر من تبادلات عملاء مركز الاتصالات والبحث في قواعد البيانات الطبية عن الأوراق البحثية ذات الصلة.
حاليًا، في المراحل الأولى من مشروع RAG، تُستخدم التكنولوجيا لتوفير استجابات دقيقة وسياقية للاستعلامات في الوقت المناسب. تُعد حالات الاستخدام هذه مُناسبة لروبوتات المحادثة والبريد الإلكتروني والرسائل النصية وتطبيقات المحادثة الأخرى.
في المستقبل، تصبح التوجهات المحتملة لتكنولوجيا RAG مساعدة الذكاء الاصطناعي المبتكر على اتخاذ إجراء مناسب استنادًا إلى المعلومات السياقية ومطالبات المستخدمين. على سبيل المثال، قد يحدد نظام الذكاء الاصطناعي المعزز من RAG تأجير عناصر العطلات الشاطئية الأعلى تصنيفًا في جزر الكناري ثم يبدأ في حجز مقصورة مكونة من غرفتين على مسافة مشي من الشاطئ خلال بطولة كرة الطائرة.
قد يكون RAG أيضًا قادرًا على المساعدة في تسلسل الأسئلة الأكثر تطورًا. اليوم، قد يكون الذكاء الاصطناعي المبتكر قادرًا على إخبار الموظف بسياسة استرداد الرسوم الدراسية للشركة؛ إذ يمكن لـ RAG إضافة المزيد من البيانات السياقية لإعلام الموظف بالمدارس القريبة التي بها دورات تتوافق مع هذه السياسة وربما توصي بالبرامج المناسبة لمهام الموظف والتدريب السابق—حتى قد تساعد في التقدم بطلب للحصول على هذه البرامج وبدء طلب التعويض.
تقدم Oracle مجموعة مُتنوعة من خدمات الذكاء الاصطناعي المُتقدمة المستندة إلى السحابة، بما في ذلك خدمة OCI Generative AI التي تعمل على Oracle Cloud Infrastructure (OCI). تتضمن عروض Oracle نماذج قوية تعتمد على البيانات الفريدة لمؤسستك والمعرفة بالمجال. لا تتم مشاركة بيانات العميل مع موفري LLM أو من عملاء آخرين، ولا يمكن استخدام النماذج المُخصصة المدربة على بيانات العميل إلا بواسطة هذا العميل.
بالإضافة إلى ذلك، تدمج Oracle الذكاء الاصطناعي المبتكر عبر مجموعة واسعة من التطبيقات السحابية، وتتوفر إمكانات الذكاء الاصطناعي المبتكر للمطورين الذين يستخدمون OCI وعبر مجموعة قواعد البيانات الخاصة بها. علاوة على ذلك، توفر خدمات الذكاء الاصطناعي من Oracle أداءً وتسعيرًا يمكن التنبؤ بهما باستخدام مجموعات الذكاء الاصطناعي أحادية المستأجر المُخصصة لاستخدامك.
إن قوة وإمكانات نماذج LLM والذكاء الاصطناعي المبتكر معروفة ومفهومة على نطاق واسع—فقد كانت موضوع عناوين الأخبار المٌبهرة خلال العام الماضي. يعتمد الإنشاء المعزز للاستعادة على مزايا نماذج LLM من خلال جعلها أنسب توقيتًا وأدق وأكثر سياقية. بالنسبة لتطبيقات الأعمال الخاصة بالذكاء الاصطناعي المبتكر، تُعد RAG تقنية مُهمة يجب مراقبتها ودراستها وتوجيهها.
توفر Oracle منصة حديثة للبيانات وبنية تحتية مُنخفضة التكلفة وعالية الأداء للذكاء الاصطناعي. توضح العوامل الإضافية، مثل النماذج القوية عالية الأداء وأمان البيانات الذي لا مثيل له وخدمات الذكاء الاصطناعي المُضمنة، سبب تصميم عرض الذكاء الاصطناعي من Oracle للمؤسسات فعلًا.
هل RAG مماثل للذكاء الاصطناعي المبتكر؟
لا، فالإنشاء المعزز للاستعادة تقنية يمكنها تقديم نتائج أدق للاستعلامات من نموذج لغة كبير عام من تلقاء نفسه، لأن RAG يستخدم المعرفة الخارجية للبيانات الموجودة بالفعل في LLM.
ما نوع المعلومات الذي يتم استخدامه في RAG؟
يمكن لـ RAG دمج البيانات من مصادر عديدة، مثل قواعد البيانات الارتباطية ومستودعات المستندات غير المنظمة وتدفقات بيانات الإنترنت ومواجز أخبار الوسائط والنصوص الصوتية وسجلات المعاملات.
كيف يستخدم الذكاء الاصطناعي المبتكر RAG؟
يتم تضمين البيانات من مصادر بيانات المؤسسة إلى مستودع المعرفة ثم تحويلها إلى متجهات، يتم تخزينها في قاعدة بيانات متجهات. عندما يُجري مستخدم نهائي استعلام، تستعيد قاعدة بيانات المتجهات المعلومات السياقية ذات الصلة. يتم إرسال هذه المعلومات السياقية، إلى جانب الاستعلام، إلى نموذج اللغة الكبير، الذي يستخدم السياق لإنشاء استجابة أنسب توقيتًا وأدق وأكثر سياقية.
هل يمكن أن يشير RAG إلى مراجع للبيانات التي يستعيدها؟
نعم. تحتوي قواعد بيانات المتجهات ومستودعات المعرفة التي يستخدمها RAG على معلومات مُحددة حول مصادر المعلومات. يعني هذا أنه يمكن ذكر المصادر، وإذا كان ثمة خطأ في أحد هذه المصادر، فيمكن تصحيحها أو حذفها بسرعة حتى لا تُرجع الاستعلامات اللاحقة هذه المعلومات غير الصحيحة.