في محاولة لتبسيط المهام المتكررة أو أتمتتها بالكامل، لماذا لا تستعين بمساعدة الذكاء الاصطناعي؟ قد يبدو استخدام نموذج أساس لأتمتة المهام المتكررة أمرًا جذابًا، ولكنه قد يعرض البيانات السرية للخطر. الإنشاء المعزز بالاسترجاع (RAG) هو بديل للضبط الدقيق، مع الاحتفاظ ببيانات الاستدلال معزولة عن مجموعة النموذج.
نريد الحفاظ على فصل بيانات الاستدلال ونموذجها—لكننا نريد أيضًا خيارًا نستخدم فيه نموذج اللغة الكبير (LLM) ووحدة معالجة رسومات (GPU) قوية لتحقيق الكفاءة. تخيل إذا كان بإمكانك القيام بكل هذا باستخدام وحدة معالجة رسومات واحدة فقط!
في هذا العرض التوضيحي، سنوضح كيفية نشر حل RAG باستخدام وحدة معالجة رسومات NVIDIA A10 واحدة؛ وإطار عمل مفتوح المصدر مثل LangChain أو LlamaIndex أو Qdrant أو vLLM؛ وLLM خفيف مكون من 7 مليارات معلمة من Mistral AI. إنه توازن ممتاز بين السعر والأداء ويحافظ على فصل بيانات الاستدلال أثناء تحديث البيانات حسب الحاجة.