Key points are not available for this paper at this time.
대형 언어 모델의 도입이 증가하고 사용자별 또는 작업별 모델 맞춤화의 필요성이 커짐에 따라, 저차원 적응(LoRA) 및 그 변형과 같은 파라미터 효율적 미세 조정(PEFT) 방법은 상당한 저장 및 전송 비용을 초래합니다. 저장된 파라미터를 더욱 줄이기 위해, 우리는 벡터 뱅크를 통한 글로벌 파라미터 공유로 행렬 차원, 모듈, 레이어 간 저차원 분해의 장벽을 허무는 "분할-공유" 패러다임을 소개합니다. LoRA에 대한 이 패러다임의 구체화로서, 제안하는 VB-LoRA는 미분 가능한 top-k 혼합 모듈과 함께 공유 벡터 뱅크에서 LoRA의 모든 저차원 행렬을 합성합니다. VB-LoRA는 최첨단 PEFT 방법과 비교하여 동등하거나 우수한 성능을 유지하면서 극도의 파라미터 효율성을 달성합니다. 광범위한 실험으로 자연어 이해, 자연어 생성, 지침 튜닝 작업에서 VB-LoRA의 효과를 입증했습니다. Llama2-13B 모델 미세 조정 시, VB-LoRA는 LoRA 저장 파라미터의 0.4% 만 사용하면서도 뛰어난 결과를 얻습니다. 소스 코드는 https://github.com/leo-yangli/VB-LoRA 에서 확인할 수 있습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Li Yang
Shaobo Han
Shihao Ji
Building similarity graph...
Analyzing shared references across papers
Loading...
Yang 등(목요일,)이 이 질문을 연구했습니다.
www.synapsesocial.com/papers/68e68be2b6db643587613446 — DOI: https://doi.org/10.48550/arxiv.2405.15179