May 31, 2024Open Access

Aprimorando a Robustez ao Ruído de Modelos de Linguagem Aumentados por Recuperação com Treinamento Adversarial Adaptativo

Key Points

Key points are not available for this paper at this time.

Abstract

Grandes Modelos de Linguagem (LLMs) exibem capacidades substanciais, mas enfrentam desafios, incluindo alucinações, conhecimento desatualizado e processos de raciocínio não rastreáveis. A geração aumentada por recuperação (RAG) emergiu como uma solução promissora, integrando conhecimento de bases de dados externas para mitigar esses desafios. No entanto, passagens recuperadas inadequadamente podem prejudicar a capacidade dos LLMs de gerar respostas abrangentes e de alta qualidade. Estudos anteriores sobre a robustez ao ruído de recuperação em RAG frequentemente se limitam a um conjunto restrito de tipos de ruído, desviando-se dos ambientes reais de recuperação e limitando a aplicabilidade prática. Neste estudo, inicialmente investigamos ruídos de recuperação e os categorizamos em três tipos distintos, refletindo ambientes reais. Analisamos o impacto desses variados ruídos na robustez dos LLMs. Subsequentemente, propomos uma nova abordagem RAG conhecida como Treinamento Adversarial Adaptativo Aumentado por Recuperação (RAAT). O RAAT utiliza treinamento adversarial adaptativo para ajustar dinamicamente o processo de treinamento do modelo em resposta aos ruídos de recuperação. Paralelamente, emprega aprendizado multi-tarefa para garantir a capacidade do modelo de reconhecer internamente contextos ruidosos. Experimentos extensivos demonstram que o modelo LLaMA-2 7B treinado com RAAT apresenta melhorias significativas nos escores F1 e EM sob diversas condições de ruído. Para reprodutibilidade, liberamos nosso código e dados em: https://github.com/calubkk/RAAT.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Feiteng Fang

Yuelin Bai

Shiwen Ni

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Aprimorando a Robustez ao Ruído de Modelos de Linguagem Aumentados por Recuperação com Treinamento Adversarial Adaptativo

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study