What type of study is this?

This is a Quantitative Study study.

September 28, 2025Open Access

记忆增强语言模型能否在“干草堆中的推理”任务中实现泛化？

Key Points

MemReasoner在推理任务中表现出强大的泛化能力，显著优于基线模型。
在两个不同的多跳推理任务上，MemReasoner经过最小辅助事实监督训练，实现了稳健的性能。
该模型采用创新的记忆增强架构，提升语言模型在推理任务中的上下文处理能力。
研究结果强调了显式记忆机制与弱监督结合在语言模型中的有效性。

Abstract

大型语言模型在推理任务中常表现出其脆弱性，尤其是在对上下文执行长链推理时。我们提出了MemReasoner，一种新的简单记忆增强LLM架构，其中记忆模块学习上下文事实的相对顺序，并支持跳跃访问这些事实，而解码器则选择性地关注记忆。MemReasoner端到端训练，支持不同程度的辅助事实监督。我们将MemReasoner与现有的记忆增强变压器模型及状态空间模型一同训练，涉及两个不同的合成多跳推理任务。涵盖了复杂场景的实验——包括测试集中存在长干扰文本或目标答案变化——显示MemReasoner在单跳和两跳任务上均具备强泛化能力。该泛化表现是在无至弱辅助事实监督条件下实现（单跳任务不使用，双跳任务使用1%的辅助事实）。相比之下，基线模型整体难以泛化，并且即使采用完整辅助事实监督也收益有限。结果凸显了结合弱监督的显式记忆机制对提升大型语言模型上下文处理能力和推理任务性能的重要性。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Payel Das

Ching-Yun Ko

Sihui Dai

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

记忆增强语言模型能否在“干草堆中的推理”任务中实现泛化？

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider