What question did this study set out to answer?

目标是开发一种更有效的记忆架构，以提升大型语言模型的连续性和知识访问能力。

April 7, 2026Open Access

超越上下文窗口：大语言模型中可扩展持久记忆的STAR框架

Key Points

目标是开发一种更有效的记忆架构，以提升大型语言模型的连续性和知识访问能力。
引入STAR，一种将存储与推理上下文解耦的分层记忆架构。
利用以语义标签索引的文件存储系统。
实现相关内容按需检索到指定区域。
展示了STAR增强模型可访问3910万个令牌的知识。
显示相较传统受限上下文模型知识保留约提升20倍。
实现硬件可扩展性，且可在现有基础设施部署，无需再训练。

Abstract

大型语言模型（LLMs）在根本上受限于其上下文窗口——单次推理会话中可在活动工作记忆中持有的信息最大量。当达到上下文限制时，系统会压缩或丢弃早期内容，破坏连续性和累积知识。本文介绍STAR（结构化树与主动检索），一种分层记忆架构，将知识存储与主动推理上下文解耦。STAR维护一个以轻量语义标签索引的持久文件存储系统，这些标签永久占据活动上下文窗口的一小部分保留空间。当需要相关内容时，该内容按需检索到专门的检索区，使用后带更新返回存储。该架构使得上下文窗口受限的模型能够访问比其本地上下文大小大数个数量级的知识库。配备STAR的Gemma 4 E4B模型，具有128K令牌上下文窗口，可访问多达3910万个条理清晰的持久知识——约为200万令牌平铺上下文模型可访问知识的20倍。STAR与模型无关，硬件可扩展，且可在现有LLM基础设施上部署，无需再训练。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Joshua Knoechelma

Actions

Institutions

Chronos Technology (United Kingdom)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

超越上下文窗口：大语言模型中可扩展持久记忆的STAR框架

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider