ما المقصود بنموذج اللغة الكبيرة (LLM)؟

مارك جاكلي | محلل استراتيجي للمحتوى | فبراير 16؜ 2024

يمثل نموذج اللغة الكبيرة (LLM) نوع شائع بشكل متزايد من الذكاء الاصطناعي المصمم لإنشاء ردود مكتوبة مماثلة لردود البشر على الاستعلامات. يتم تدريب نماذج LLM على كميات كبيرة من البيانات النصية وتعلم التنبؤ بالكلمة التالية أو تسلسل الكلمات، بناءً على السياق المُقدم—حتى أنه يمكن أن يحاكي أسلوب الكتابة لمؤلف أو نوع معين.

ظهرت LLMs من المختبرات وتناقلتها الأخبار في بداية العشرينات ن القرن الحالي وتحولت منذ ذلك الحين إلى كل من المنتجات المستقلة وإمكانات القيمة المضافة المُضمنة في العديد من أنواع برامج الأعمال. بفضل قدرتها المثيرة للإعجاب على تفسير الطلبات وإنتاج ردود مُفيدة، يتم استخدام نماذج LLM في مجموعة واسعة من التطبيقات، بما في ذلك معالجة اللغة الطبيعية والترجمة الآلية وإنشاء المحتوى وروبوتات المحادثة وتلخيص المستندات.

ما هو نموذج اللغة الكبير؟

يمثل نموذج اللغة الكبير (LLM) نظام ذكاء اصطناعي تم تدريبه على مجموعة بيانات واسعة وتتكون غالبًا من مليارات الكلمات المأخوذة من الكتب والويب والمصادر الأخرى، لإنشاء استجابات شبيهة باستجابات الإنسان وذات صلة بالسياق للاستعلامات. نظرًا إلى أن نماذج LLM مُصممة لفهم الأسئلة—التي تسمى "المطالبات" في مصطلحات LLM—وإنشاء استجابات باللغة الطبيعية، يمكنها أداء مهام مثل الإجابة على أسئلة العملاء، وتلخيص المعلومات في تقرير، وإنشاء المسودات الأولى لرسائل البريد الإلكتروني، حتى كتابة الشعر وتعليمات برميجة للكمبيوتر. تتمتع نماذج LLM عادةً بفهم عميق لقواعد ودلالات اللغة التي يتم تدريبها عليه، ويمكن صقلها باستخدام بيانات الشركة الخاصة.

نظرًا إلى أنه يمكنها التعرُّف على اللغة البشرية وتفسيرها—على الرغم من عدم فهمها حقًا بالطريقة التي يفعلها البشر—تمثل LLM تقدمًا كبيرًا في معالجة اللغة الطبيعية. من المحتمل أن يكون نموذج LLM الأشهر هو ChatGPT، برنامج الذكاء الاصطناعي من OpenAI المّدرَّب على مليارات الكلمات من الكتب والمقالات ومواقع الويب. توفر الشركة إمكانية الوصول المباشر إلى ChatGPT عبر متصفح ويب أو تطبيق هاتف محمول، أو يمكن ربطها ببرامج الأعمال عبر واجهات برمجة التطبيقات القابلة للبرمجة. تتضمن نماذج LLM الشائعة الأخرى Cohere وGPT-4 وBARD.

يمكن هيكلة البيانات النصية المستخدمة لتدريب نموذج LLM، كما في قاعدة البيانات، أو قد لا تكون مهيكلة. لدى معظم الشركات كميات هائلة من البيانات غير المهيكلة، بما في ذلك الرسائل النصية ورسائل البريد الإلكتروني والمستندات.

تتضمن الاستخدامات التجارية الشائعة لنماذج LLM روبوتات محادثة خدمة العملاء والمساعدين الرقميين وخدمات الترجمة الأكثر سياقية وعامية وذات أصوات طبيعية عن أدوات الترجمة التقليدية للكلمات مقابل الكلمات. يمكن أن تؤدي نماذج LLM أيضًا مهام مُتقدمة إلى حد ما، مثل التنبؤ ببُنى البروتين وكتابة التعليمات البرميجة للبرنامج. تعد الرعاية الصحية والمستحضرات الصيدلانية والإدارة المالية والبيع بالتجزئة من بين الصناعات التي تستخدم نماذج LLM بشكل جيد. على سبيل المثال، قد يستخدم مقدم الرعاية الصحية نموذج LLM لفرز المرضى الذين يتصلون بخط ساخن، في حين قد تستخدم شركة استثمارية واحدة للتدقيق في تقارير الأرباح والقصص الإخبارية ومشاركات وسائل التواصل الاجتماعي وتلخيصها لتحديد اتجاهات الأسهم. يمكن أن تساعد نماذج LLM المؤسسات على إدارة البيانات وتحليلها، واستخلاص الرؤى التي قد تنشئ قيمة للأعمال. وفي كلا السيناريوهين، يقوم نموذج LLM بالمهمة أسرع مما يمكن للمحللين البشريين.

أدى ذلك إلى اهتمام كبير بالتكنولوجيا، لدرجة أنه من المتوقع أن ينمو السوق العالمي لنماذج LLM بمعدل نمو سنوي مركب يبلغ 21.4٪ ليصل إلى 40.8 مليار دولار أمريكي بحلول عام 2029، وفقًا إلى البحث الذي أجرته Valuates Reports لعام 2023.

توجد بعض المفاهيم الرئيسة التي يجب فهمها عند التفكير في نماذج LLM. وتتضمن ما يلي:

  • اللغة الطبيعية. لم يتم تطوير أي لغة يستخدمها البشر في المواقف العادية، مثل المحادثات أو التقارير المكتوبة لغرض تقني، مثل التعليمات البرميجة للكمبيوتر.
  • معالجة اللغات الطبيعية. نوع من معالجة البيانات يمكنه تحليل بنية النصوص المكتوبة أو المنطوقة ومعناها.
  • نموذج اللغة. نموذج للغة الطبيعية يمكنه التنبؤ بأفضل كلمة تالية في عبارة أو جملة ضمن السياق المطلوب.

مثل البشر، نماذج LLM ليست مثالية. تعتمد جودة مخرجاتها على جودة مدخلاتها—أي المعلومات المستخدمة لتدريبها. يمكن أن تؤدي البيانات القديمة إلى أخطاء، مثل روبوت محادثة يقدم إجابة خاطئة حول منتجات الشركة. قد يتسبب نقص البيانات الكافية في اختلاق نماذج LLM للإجابات، أو "الهذي". في حين أن نماذج LLM رائعة في التنبؤ في الوقت الحالي على أي حال، إلا أنها أقل جودة في شرح طريقة التوصل إلى استنتاج معين. ويتم تدريب العديد من نماذج LLM باستخدام الكتب والمقالات الصحفية وحتى صفحات ويكيبيديا، مما يؤدي إلى مخاوف بشأن انتهاك حقوق الطبع والنشر. عند عدم إدارتها بدقة، قد تمثل نماذج LLM تحديات أمان من خلال، على سبيل المثال استخدام معلومات حساسة أو خاصة في استجابة.

يمكن أن تساعد تقنية الذكاء الاصطناعي المسماة التوليد المعزز بالاسترداد (RAG) في بعض هذه المشكلات من خلال تحسين دقة مخرجات نماذج LLM وملاءمتها. يوفر RAG طريقة لإضافة معلومات مستهدفة دون تغيير النموذج الأساس. تنشئ نماذج RAG مستودعات معرفة—تستند عادةً إلى بيانات المؤسسة الخاصة—ويمكن تحديثها باستمرار لتوفير إجابات سياقية وفي الوقت المناسب. على سبيل المثال، قد تستخدم روبوتات المحادثة وأنظمة المحادثة الأخرى RAG للتأكد من أن إجاباتها على أسئلة العملاء تستند إلى المعلومات الحالية حول المخزون وتفضيلات المشتري وعمليات الشراء السابقة، مع استبعاد المعلومات القديمة أو غير ذات الصلة بالسياق التشغيلي المقصود في نموذج LLM.

يؤدي إنشاء مركز تميز للذكاء الاصطناعي قبل بدء التدريب الخاص بالمؤسسة إلى زيادة احتمالات النجاح. وكتابنا الإلكتروني يشرح أسباب هذا ويقدم نصائح عن بناء CoE فعال.

الأسئلة الشائعة حول نموذج اللغة الكبيرة

ما أفضل خمسة نماذج لغة كبيرة؟

يختلف الخبراء على أهم نماذج LLM، لكن خمسة أن العديد يروج إلى GPT-4 من OpenAI وClaude 2 من Anthropic وLlama 2 من Meta وOrca 2 من Microsoft Research وCommand from Cohere. يأتي ChatGPT أيضًا من OpenAI.

ما الفَرق بين نماذج LLM والذكاء الاصطناعي؟

يُعد الذكاء الاصطناعي مصطلح واسع يشمل العديد من التقنيات التي يمكن أن تحاكي السلوك أو الإمكانات المماثلة للبشر. تمثل نماذج اللغات الكبيرة نوع من الذكاء الاصطناعي التوليدي، وهو المصطلح الشامل لنماذج الذكاء الاصطناعي التي تنشئ المحتوى بما في ذلك النص والصور والفيديو واللغة المنطوقة والموسيقى.