Key points are not available for this paper at this time.
ساهمت النماذج اللغوية الكبيرة (LLMs) بشكل كبير في تطوير الوكلاء الأذكياء التكيفيين وتُعتبر وسيلة هامة لتحقيق الذكاء الاصطناعي العام (AGI). ومع ذلك، تميل النماذج اللغوية الكبيرة إلى إنتاج معلومات غير صحيحة من الناحية الواقعية وغالبًا ما تُنتج محتوى "شبح" يقلل من موثوقيتها، مما يشكل تحدياً خطيراً لنشرها في السيناريوهات الحياتية الحقيقية. تحسين النماذج اللغوية الكبيرة من خلال دمج قواعد البيانات الخارجية وآليات استرجاع المعلومات يعد طريقًا فعّالاً. لمواجهة هذه التحديات، نقترح نهجًا جديدًا يُسمى WeKnow-RAG، والذي يدمج البحث على الويب والرسوم البيانية المعرفية في نظام "التوليد المعزز بالاستخراج (RAG)". أولاً، يتم تحسين دقة وموثوقية استجابات النماذج اللغوية الكبيرة عبر الجمع بين التمثيل الهيكلي للرسوم البيانية المعرفية ومرونة استرجاع المتجهات الكثيفة. ثم يستخدم WeKnow-RAG الرسوم البيانية المعرفية الخاصة بالمجال لتلبية مجموعة متنوعة من الاستفسارات والمجالات، مما يحسّن الأداء في المعلومات الواقعية والمهام الاستدلالية المعقدة من خلال تقنيات استرجاع صفحات الويب متعددة المراحل باستخدام طرق الاسترجاع المتفرقة والكثيفة. يوازن نهجنا بفعالية بين كفاءة ودقة استرجاع المعلومات، ما يُحسّن العملية العامة للاستخراج. أخيرًا، ندمج أيضاً آلية تقييم ذاتي للنموذج اللغوي الكبير لتقييم موثوقية الأجوبة التي يولدها. يثبت نهجنا فعاليته المتميزة في مجموعة واسعة من التجارب غير المتصلة والبيانات المُرسلة عبر الإنترنت.
Building similarity graph...
Analyzing shared references across papers
Loading...
Weijian Xie
Xuefeng Liang
Yuhui Liu
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Xie وآخرون هذا السؤال.
www.synapsesocial.com/papers/68e5c453b6db64358755ab04 — DOI: https://doi.org/10.48550/arxiv.2408.07611