Key points are not available for this paper at this time.
Grandes Modelos de Linguagem (LLMs) exibem capacidades substanciais, mas enfrentam desafios, incluindo alucinações, conhecimento desatualizado e processos de raciocínio não rastreáveis. A geração aumentada por recuperação (RAG) emergiu como uma solução promissora, integrando conhecimento de bases de dados externas para mitigar esses desafios. No entanto, passagens recuperadas inadequadamente podem prejudicar a capacidade dos LLMs de gerar respostas abrangentes e de alta qualidade. Estudos anteriores sobre a robustez ao ruído de recuperação em RAG frequentemente se limitam a um conjunto restrito de tipos de ruído, desviando-se dos ambientes reais de recuperação e limitando a aplicabilidade prática. Neste estudo, inicialmente investigamos ruídos de recuperação e os categorizamos em três tipos distintos, refletindo ambientes reais. Analisamos o impacto desses variados ruídos na robustez dos LLMs. Subsequentemente, propomos uma nova abordagem RAG conhecida como Treinamento Adversarial Adaptativo Aumentado por Recuperação (RAAT). O RAAT utiliza treinamento adversarial adaptativo para ajustar dinamicamente o processo de treinamento do modelo em resposta aos ruídos de recuperação. Paralelamente, emprega aprendizado multi-tarefa para garantir a capacidade do modelo de reconhecer internamente contextos ruidosos. Experimentos extensivos demonstram que o modelo LLaMA-2 7B treinado com RAAT apresenta melhorias significativas nos escores F1 e EM sob diversas condições de ruído. Para reprodutibilidade, liberamos nosso código e dados em: https://github.com/calubkk/RAAT.
Building similarity graph...
Analyzing shared references across papers
Loading...
Feiteng Fang
Yuelin Bai
Shiwen Ni
Building similarity graph...
Analyzing shared references across papers
Loading...
Fang et al. (Sex,) estudaram esta questão.
www.synapsesocial.com/papers/68e6785bb6db643587602a6b — DOI: https://doi.org/10.48550/arxiv.2405.20978