Key points are not available for this paper at this time.
Retrieval-Augmented Generation (RAG) é uma abordagem prevalente para infundir uma base de conhecimento privada de documentos com Large Language Models (LLM) para construir sistemas generativos de Q&A (Question-Answering). Contudo, a precisão do RAG torna-se cada vez mais desafiadora à medida que o corpus de documentos cresce, com os Recuperadores desempenhando um papel desproporcional na precisão geral do RAG ao extrair o documento mais relevante do corpus para fornecer contexto ao LLM. Neste artigo, propomos o método 'Blended RAG' que utiliza técnicas de busca semântica, como índices de Vetores Densos e índices Sparse Encoder, combinados com estratégias de consulta híbridas. Nosso estudo alcança melhores resultados de recuperação e estabelece novos benchmarks para conjuntos de dados de IR (Information Retrieval) como NQ e TREC-COVID. Estendemos ainda esse 'Recuperador Misturado' ao sistema RAG para demonstrar resultados muito superiores em conjuntos de dados generativos de Q&A como SQUAD, até mesmo superando o desempenho de fine-tuning.
Building similarity graph...
Analyzing shared references across papers
Loading...
Kunal Sawarkar
Abhilasha Mangal
Shivam R Solanki
Building similarity graph...
Analyzing shared references across papers
Loading...
Sawarkar et al. (Sex,) estudaram essa questão.
www.synapsesocial.com/papers/68e72babb6db6435876a5b84 — DOI: https://doi.org/10.48550/arxiv.2404.07220