What question did this study set out to answer?

O objetivo é apresentar o mLoRA, um sistema para ajuste fino eficiente de Grandes Modelos de Linguagem usando técnicas inovadoras.

March 3, 2026Open Access

Uma Demonstração do mLoRA: Um Sistema de Ajuste Fino de LLMs Eficiente em Paralelismo

Key Points

O objetivo é apresentar o mLoRA, um sistema para ajuste fino eficiente de Grandes Modelos de Linguagem usando técnicas inovadoras.
Foi introduzido o LoRAPP para maximizar o uso da GPU em múltiplas GPUs.
Foi utilizado o BatchLoRA para consolidar múltiplas tarefas em menos operações.
Implementado um escalonador de tarefas consciente da memória para eficiência na alocação de recursos.
Alcançou treinamento 30–45% mais rápido em comparação com métodos paralelos atuais.
Demonstrada a efetividade em tarefas de banco de dados como Text2SQL e LLM4DP.

Abstract

Este artigo apresenta uma demonstração do mLoRA, um sistema para ajuste fino paralelo e eficiente de Grandes Modelos de Linguagem (LLMs) usando Adaptação de Baixa Ordem (LoRA). O mLoRA introduz dois componentes principais: LoRAPP, um mecanismo de paralelismo em pipeline sem latência que aproveita a independência dos adaptadores LoRA para maximizar a utilização da GPU em várias GPUs, e BatchLoRA, um operador personalizado que consolida múltiplas tarefas LoRA em operações matriciais em lote para reduzir a sobrecarga do lançamento do kernel. O sistema também inclui um escalonador de tarefas consciente da memória para alocação eficiente de recursos. Demonstrado em tarefas relacionadas a banco de dados, incluindo Text2SQL e pré-processamento de dados baseado em LLM (LLM4DP), o mLoRA alcança um treinamento 30–45% mais rápido em comparação com métodos paralelos existentes e foi implantado em produção na AntGroup. Este artigo de demonstração foi submetido à Trilha de Demonstração do PVLDB 2025 e serve como complemento ao artigo de pesquisa completo aceito no VLDB 2025.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zelong Huang

Zhengmao Ye

Salma Filali

Actions

Institutions

Cornell University

Sichuan University

The University of Texas at Arlington

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Uma Demonstração do mLoRA: Um Sistema de Ajuste Fino de LLMs Eficiente em Paralelismo

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider