May 23, 2024Open Access

VB-LoRA: 벡터 뱅크를 활용한 극한의 파라미터 효율적 미세 조정

Key Points

Key points are not available for this paper at this time.

Abstract

대형 언어 모델의 도입이 증가하고 사용자별 또는 작업별 모델 맞춤화의 필요성이 커짐에 따라, 저차원 적응(LoRA) 및 그 변형과 같은 파라미터 효율적 미세 조정(PEFT) 방법은 상당한 저장 및 전송 비용을 초래합니다. 저장된 파라미터를 더욱 줄이기 위해, 우리는 벡터 뱅크를 통한 글로벌 파라미터 공유로 행렬 차원, 모듈, 레이어 간 저차원 분해의 장벽을 허무는 "분할-공유" 패러다임을 소개합니다. LoRA에 대한 이 패러다임의 구체화로서, 제안하는 VB-LoRA는 미분 가능한 top-k 혼합 모듈과 함께 공유 벡터 뱅크에서 LoRA의 모든 저차원 행렬을 합성합니다. VB-LoRA는 최첨단 PEFT 방법과 비교하여 동등하거나 우수한 성능을 유지하면서 극도의 파라미터 효율성을 달성합니다. 광범위한 실험으로 자연어 이해, 자연어 생성, 지침 튜닝 작업에서 VB-LoRA의 효과를 입증했습니다. Llama2-13B 모델 미세 조정 시, VB-LoRA는 LoRA 저장 파라미터의 0.4% 만 사용하면서도 뛰어난 결과를 얻습니다. 소스 코드는 https://github.com/leo-yangli/VB-LoRA 에서 확인할 수 있습니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Li Yang

Shaobo Han

Shihao Ji

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

VB-LoRA: 벡터 뱅크를 활용한 극한의 파라미터 효율적 미세 조정

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study