检索增强生成(RAG)作为一种强大的范式,通过在推理时基于检索到的外部证据来调节生成,增强了大型语言模型(LLMs)。虽然RAG解决了参数化知识存储的关键限制——如事实不一致性和领域僵化——但它也带来了检索质量、定位可靠性、流程效率以及对噪声或对抗性输入的鲁棒性等新挑战。本文综述全面整合了最近在RAG系统方面的进展,提出一个将架构分类为检索器中心、生成器中心、混合及鲁棒性导向设计的分类法。我们系统分析了在检索优化、上下文过滤、解码控制和效率改进方面的增强,辅以短文本和多跳问答任务的比较性能分析。此外,我们回顾了最先进的评估框架和基准测试,强调了检索感知评估、鲁棒性测试及联邦检索设置的趋势。我们的分析揭示了检索准确性与生成灵活性、效率与真实性、模块化与协调性的反复权衡。最后,我们指出了包括自适应检索架构、实时检索集成、多跳证据的结构化推理及隐私保护检索机制在内的开放挑战和未来研究方向。本综述旨在整合当前RAG领域的知识,并为下一代检索增强语言建模系统奠定基础。
Building similarity graph...
Analyzing shared references across papers
Loading...
Chhavi Sharma
Building similarity graph...
Analyzing shared references across papers
Loading...
Chhavi Sharma(星期三)研究了这一问题。
www.synapsesocial.com/papers/68e6bc5f38ca8e474d549e92 — DOI: https://doi.org/10.48550/arxiv.2506.00054
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: