حل الذكاء الاصطناعي

أتمتة المهام بأمان باستخدام RAG واختيار نماذج LLM.

مقدمة

في محاولة لتبسيط المهام المتكررة أو أتمتتها بالكامل، لماذا لا تستعين بمساعدة الذكاء الاصطناعي؟ قد يبدو استخدام نموذج أساس لأتمتة المهام المتكررة أمرًا جذابًا، ولكنه قد يعرض البيانات السرية للخطر. الإنشاء المعزز بالاسترجاع (RAG) هو بديل للضبط الدقيق، مع الاحتفاظ ببيانات الاستدلال معزولة عن مجموعة النموذج.

نريد الحفاظ على فصل بيانات الاستدلال ونموذجها—لكننا نريد أيضًا خيارًا نستخدم فيه نموذج اللغة الكبير (LLM) ووحدة معالجة رسومات (GPU) قوية لتحقيق الكفاءة. تخيل إذا كان بإمكانك القيام بكل هذا باستخدام وحدة معالجة رسومات واحدة فقط!

في هذا العرض التوضيحي، سنوضح كيفية نشر حل RAG باستخدام وحدة معالجة رسومات NVIDIA A10 واحدة؛ وإطار عمل مفتوح المصدر مثل LangChain أو LlamaIndex أو Qdrant أو vLLM؛ وLLM خفيف مكون من 7 مليارات معلمة من Mistral AI. إنه توازن ممتاز بين السعر والأداء ويحافظ على فصل بيانات الاستدلال أثناء تحديث البيانات حسب الحاجة.

العرض التوضيحي

عرض توضيحي: أتمتة المهام بأمان باستخدام RAG واختيار نماذج LLM (1:15)

المتطلبات الأساسية والإعداد

  1. حساب Oracle Cloud—صفحة التسجيل
  2. مثيل حوسبة Oracle GPU—الوثائق
  3. LlamaIndex-الوثائق
  4. LangChain-الوثائق
  5. vLLM—الوثائق
  6. Qdrant—الوثائق