Los puntos clave no están disponibles para este artículo en este momento.
Low-Rank Adaptation (LoRA) ofrece una solución efectiva y eficiente para el ajuste fino de modelos de lenguaje grandes (LLM). La naturaleza modular y plug-and-play de LoRA permite la integración de diversas LoRAs específicas de dominio para mejorar las capacidades de los LLM. Investigaciones previas sobre la explotación de múltiples LoRAs se centran ya sea en tareas específicas aisladas o fijan la selección de LoRAs durante el entrenamiento. Sin embargo, en escenarios del mundo real, los LLM reciben indicaciones diversas que cubren diferentes tareas, y el conjunto de LoRAs candidatos suele actualizarse dinámicamente. Para cerrar esta brecha, proponemos LoraRetriever, un marco de recuperar y luego componer que recupera y compone adaptativamente múltiples LoRAs según las indicaciones de entrada. LoraRetriever contiene tres componentes principales: primero, identificar y recuperar LoRAs relevantes para la entrada dada; segundo, formular estrategias para integrar eficazmente las LoRAs recuperadas; y tercero, desarrollar inferencia por lotes eficiente para acomodar solicitudes heterogéneas. Los resultados experimentales indican que LoraRetriever supera consistentemente a los puntos de referencia, resaltando su efectividad práctica y versatilidad.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ziyu Zhao
Leilei Gan
Guoyin Wang
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhao et al. (Thu,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e79181b6db643587702df7 — DOI: https://doi.org/10.48550/arxiv.2402.09997