May 24, 2024Open Access

Seleção de Base: Decomposição de Baixa Posto de Modelos de Linguagem Grandes Pré-treinados para Aplicações Alvo

Key Points

Key points are not available for this paper at this time.

Abstract

Modelos de linguagem grandes (LLMs) melhoram significativamente o desempenho de várias aplicações, mas são computacionalmente intensivos e demandam muita energia. Isso torna desafiador implantá-los em dispositivos com recursos limitados, como computadores pessoais e dispositivos móveis/usáveis, e resulta em custos substanciais de inferência em ambientes com muitos recursos, como servidores em nuvem. Para ampliar o uso dos LLMs, introduzimos uma abordagem de decomposição de baixa posto para comprimir efetivamente esses modelos, adaptada aos requisitos de aplicações específicas. Observamos que LLMs pré-treinados em conjuntos de dados gerais contêm muitos componentes redundantes não necessários para aplicações particulares. Nosso método foca em identificar e remover essas partes redundantes, mantendo apenas os elementos necessários para as aplicações alvo. Especificamente, representamos as matrizes de pesos dos LLMs como uma combinação linear de componentes base. Em seguida, podaremos as bases irrelevantes e melhoramos o modelo com novas bases benéficas para aplicações específicas. Resultados de compressão profunda nos modelos Llama 2-7b e -13B, realizados em aplicações alvo incluindo raciocínio matemático e geração de código, mostram que nosso método reduz significativamente o tamanho do modelo enquanto mantém precisão comparável às técnicas de compressão de baixa posto estado-da-arte.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yang Li

Changsheng Zhao

Hyungtak Lee

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Seleção de Base: Decomposição de Baixa Posto de Modelos de Linguagem Grandes Pré-treinados para Aplicações Alvo

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider