Grandes Modelos de Linguagem (LLMs) têm sido amplamente adotados recentemente em agentes conversacionais. No entanto, as interações cada vez mais longas entre usuários e agentes acumulam extensos registros de diálogo, tornando difícil para LLMs com janelas de contexto limitadas manter uma memória de diálogo coerente a longo prazo e fornecer respostas personalizadas. Embora sistemas de memória aumentados por recuperação tenham surgido para enfrentar esse problema, métodos existentes frequentemente dependem de segmentação e recuperação de memória de granularidade única. Essa abordagem falha em captar conexões profundas de memória, levando à recuperação parcial de informações úteis ou ruído substancial, resultando em desempenho subótimo. Para superar essas limitações, propomos o MemGAS, uma estrutura que aprimora a consolidação de memória construindo associação de múltiplas granularidades, seleção adaptativa e recuperação. O MemGAS baseia-se em unidades de memória de múltiplas granularidades e emprega Modelos de Mistura Gaussiana para agrupar e associar novas memórias às históricas. Um roteador baseado em entropia seleciona adaptativamente a granularidade ótima avaliando distribuições de relevância da consulta e equilibrando completude da informação e ruído. Memórias recuperadas são refinadas adicionalmente via filtragem baseada em LLM. Experimentos em quatro benchmarks de memória de longo prazo demonstram que o MemGAS supera métodos de última geração em tarefas de perguntas e respostas e recuperação, alcançando desempenho superior através de diferentes tipos de consulta e configurações top-K.
Building similarity graph...
Analyzing shared references across papers
Loading...
Derong Xu
Yi Wen
Pengyue Jia
Building similarity graph...
Analyzing shared references across papers
Loading...
Xu et al. (Mon,) estudaram esta questão.
www.synapsesocial.com/papers/68da5a3ec1728099cfd11a10 — DOI: https://doi.org/10.48550/arxiv.2505.19549
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: