Key points are not available for this paper at this time.
上下文学习(ICL)使大型语言模型(LLMs)能够通过示范实现快速的任务适应。随着LLMs可用上下文长度的增加,近期实验显示ICL在多示例(示范)设置中的表现不一定能够很好地扩展。我们理论和实验上确认,原因在于更多示范分散了模型对查询的注意力,阻碍了对关键内容的理解。受人类如何通过例子学习的启发,我们提出了一种无需训练的方法FocusICL,该方法通过令牌级的琐碎过滤避免注意力被不重要内容分散,并在示范级别上运用分层注意力,进一步确保对当前查询的充分关注。我们还设计了一种基于示范模型困惑度的高效超参数搜索策略。全面实验验证FocusICL在平均表现上较传统ICL提升了5.2%,并且能够很好地扩展到多示范场景。
Building similarity graph...
Analyzing shared references across papers
Loading...
Peiwen Yuan
Shaoxiong Feng
Yiwei Li
Building similarity graph...
Analyzing shared references across papers
Loading...
Yuan等人(Sun,)研究了这个问题。
www.synapsesocial.com/papers/68e5b027b6db643587549d42 — DOI: https://doi.org/10.48550/arxiv.2408.13987
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: