Los puntos clave no están disponibles para este artículo en este momento.
La generación aumentada por recuperación (RAG) beneficia enormemente a los modelos de lenguaje (LMs) al proporcionar contexto adicional para tareas como la respuesta a preguntas basada en documentos (DBQA). A pesar de su potencial, el poder de RAG depende en gran medida de su configuración, lo que plantea la pregunta: ¿Cuál es la configuración óptima de RAG? Para responder a esto, presentamos el marco RAGGED para analizar y optimizar los sistemas RAG. En un conjunto de tareas representativas de DBQA, estudiamos dos recuperadores clásicos, uno disperso y otro denso, y cuatro LMs de alto rendimiento en arquitecturas codificador-decodificador y solo decodificador. A través de RAGGED, descubrimos que diferentes modelos se adaptan a configuraciones de RAG sustancialmente variadas. Mientras que los modelos codificador-decodificador mejoran monótonamente con más documentos, encontramos que los modelos solo decodificador pueden usar eficazmente menos de 5 documentos, a pesar de tener a menudo una ventana de contexto más larga. RAGGED ofrece además insights sobre los hábitos de utilización del contexto de los LMs, donde encontramos que los modelos codificador-decodificador se basan más en los contextos y, por lo tanto, son más sensibles a la calidad de recuperación, mientras que los modelos solo decodificador suelen depender del conocimiento memorizado durante el entrenamiento.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jennifer Hsia
Afreen Shaikh
Zhiruo Wang
Building similarity graph...
Analyzing shared references across papers
Loading...
Hsia et al. (Wed,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e74464b6db6435876be1ba — DOI: https://doi.org/10.48550/arxiv.2403.09040
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: