大型语言模型(LLMs)已成为交互式人工智能系统的关键组成部分,然而部署后它们本质上保持静态:无法从交互反馈中更新参数,且常在长时间交互过程中重复相同错误。我们提出了双流程代理(Dual-Process Agent,DPA)框架,用于持续上下文优化,实现在不修改冻结模型骨干的前提下的学习。受认知科学中双流程理论启发,DPA将每次交互事件分解为两个互补的过程:快速的系统1从显式的长期记忆中检索紧凑且相关的上下文并生成响应;缓慢的系统2则对结果进行反思,并将策划的更新写回记忆。为防止在长时间交互中过度记忆退化,DPA维护带有效用统计的列表式记忆条目,并采用保守的策展门控过滤通用、冗余或冲突的插入。六个多样化基准实验表明,DPA在GPT-5.1与Llama-3.1-8B骨干上均持续优于基础提示和竞争基线,在多种推理及知识密集型任务中表现最佳整体性能。
Building similarity graph...
Analyzing shared references across papers
Loading...
Liangyu Teng
Wei Ni
Liang Song
Electronics
Fudan University
China State Construction Engineering (China)
Building similarity graph...
Analyzing shared references across papers
Loading...
Teng 等人(星期一)研究了该问题。
www.synapsesocial.com/papers/69ba423c4e9516ffd37a2598 — DOI: https://doi.org/10.3390/electronics15061232