Key points are not available for this paper at this time.
Retrieval-Augmented Generation(RAG)은 대규모 언어 모델(LLM)과 문서의 사설 지식 기반을 결합하여 생성형 Q&A(질문-응답) 시스템을 구축하는 널리 사용되는 접근법입니다. 하지만 코퍼스 내 문서가 증가할수록 RAG의 정확도 유지가 점점 어려워지며, LLM에 문맥을 제공하기 위해 코퍼스 중 가장 관련성 높은 문서를 추출하는 리트리버가 전체 RAG 정확도에 큰 영향을 미칩니다. 본 논문에서는 Dense Vector 인덱스 및 Sparse Encoder 인덱스와 같은 의미 기반 검색 기법을 하이브리드 쿼리 전략과 혼합하는 '블렌디드 RAG' 방식을 제안합니다. 연구 결과 NQ 및 TREC-COVID와 같은 IR(정보 검색) 데이터셋에서 더 우수한 검색 성과를 달성하고 새로운 기준을 세웠습니다. 또한, 이러한 '블렌디드 리트리버'를 RAG 시스템에 적용하여 SQUAD 같은 생성형 Q&A 데이터셋에서 미세 조정(fine-tuning) 성능을 능가하는 탁월한 결과를 입증했습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Kunal Sawarkar
Abhilasha Mangal
Shivam R Solanki
Building similarity graph...
Analyzing shared references across papers
Loading...
Sawarkar 등(Fri,)이 이 질문을 연구했습니다.
www.synapsesocial.com/papers/68e72babb6db6435876a5b84 — DOI: https://doi.org/10.48550/arxiv.2404.07220
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: