أصبحت نماذج اللغة الكبيرة (LLMs) ضرورية لأنظمة الذكاء الاصطناعي التفاعلية، ومع ذلك تظل ثابتة أساسًا بعد النشر: لا يمكنها تحديث معلماتها من ملاحظات التفاعل وغالبًا ما تكرر نفس الأخطاء خلال تدفقات التفاعل الطويلة. نقترح وكيل ذو عملية مزدوجة (DPA)، وهو إطار لصقل السياق المستمر يُمكّن التعلم دون تعديل الهيكل النموذجي المجمد. مستوحى من نظرية العملية المزدوجة في علم النفس المعرفي، يقوم DPA بتقسيم كل حلقة تفاعل إلى عمليتين متممتين: النظام 1 السريع الذي يسترجع سياقًا مضغوطًا وملائمًا من ذاكرة طويلة الأمد صريحة ويولد الردود، والنظام 2 البطيء الذي يتأمل النتائج ويكتب تحديثات منتقاة مرة أخرى إلى الذاكرة. لمنع تدهور الذاكرة خلال التفاعلات الممتدة، يحافظ DPA على إدخالات ذاكرة مجزأة مع إحصائيات فائدة ويستخدم بوابة قيّم محافظة تقوم بترشيح الإضافات العامة أو المتكررة أو المتضاربة. أظهرت التجارب على ستة معايير تقييم متنوعة أن DPA يتفوق باستمرار على التحفيز البسيط والخطوط الأساسية المنافسة على كل من هياكل GPT-5.1 وLlama-3.1-8B، محققًا أفضل أداء شامل عبر مهام متعددة تتطلب التفكير والمعرفة.
Building similarity graph...
Analyzing shared references across papers
Loading...
Liangyu Teng
Wei Ni
Liang Song
Electronics
Fudan University
China State Construction Engineering (China)
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Teng et al. (Mon,) هذا السؤال.
www.synapsesocial.com/papers/69ba423c4e9516ffd37a2598 — DOI: https://doi.org/10.3390/electronics15061232
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: