大型语言模型在推理任务中常表现出其脆弱性,尤其是在对上下文执行长链推理时。我们提出了MemReasoner,一种新的简单记忆增强LLM架构,其中记忆模块学习上下文事实的相对顺序,并支持跳跃访问这些事实,而解码器则选择性地关注记忆。MemReasoner端到端训练,支持不同程度的辅助事实监督。我们将MemReasoner与现有的记忆增强变压器模型及状态空间模型一同训练,涉及两个不同的合成多跳推理任务。涵盖了复杂场景的实验——包括测试集中存在长干扰文本或目标答案变化——显示MemReasoner在单跳和两跳任务上均具备强泛化能力。该泛化表现是在无至弱辅助事实监督条件下实现(单跳任务不使用,双跳任务使用1%的辅助事实)。相比之下,基线模型整体难以泛化,并且即使采用完整辅助事实监督也收益有限。结果凸显了结合弱监督的显式记忆机制对提升大型语言模型上下文处理能力和推理任务性能的重要性。
Building similarity graph...
Analyzing shared references across papers
Loading...
Payel Das
Ching-Yun Ko
Sihui Dai
Building similarity graph...
Analyzing shared references across papers
Loading...
Das等人(Mon,)研究了该问题。
www.synapsesocial.com/papers/68d90a0f41e1c178a14f6ad2 — DOI: https://doi.org/10.48550/arxiv.2503.07903
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: