Modelos pré-treinados de visão e linguagem, como o CLIP, mostram uma impressionante capacidade de reconhecimento zero-shot e podem ser facilmente transferidos para tarefas específicas subsequentes via ajuste de prompt, mesmo com dados de treinamento limitados. No entanto, os métodos existentes de ajuste de prompt enfrentam dois desafios principais: (1) Em cenários few-shot, a escassez de dados frequentemente leva ao overfitting, tornando o modelo sensível a mudanças no domínio da entrada. (2) Para mitigar o overfitting, esses métodos normalmente dependem de arquiteturas de modelo específicas para a tarefa complexas e ajuste sensível de hiperparâmetros, restringindo severamente sua aplicabilidade geral. Para abordar essas questões, propomos uma estrutura mais simples e geral chamada GLAD (Generalizable LoRA tuning with RegulArized GraDient). Demonstramos que simplesmente aplicar LoRA alcança desempenho nas tarefas subsequentes comparável aos métodos baseados em prompt de última geração. Embora LoRA seja eficaz e fácil de usar, continua suscetível ao overfitting em cenários de aprendizado few-shot. Para mitigar esse risco, introduzimos uma técnica de regularização baseada em gradiente. Essa técnica direciona efetivamente a trajetória de otimização, incentivando o modelo a encontrar uma região de parâmetros mais estável que seja robusta a variações na distribuição dos dados. Por meio de experimentos extensivos conduzidos em 15 conjuntos de dados de referência, demonstramos que o GLAD supera abordagens anteriores de ajuste em termos de generalização de classes base para novas, generalização de domínio de imagem e generalização entre conjuntos de dados. O código estará disponível publicamente.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yuqi Peng
Pengfei Wang
Jianzhuang Liu
Building similarity graph...
Analyzing shared references across papers
Loading...
Peng et al. (Thu,) estudaram essa questão.
www.synapsesocial.com/papers/68f4b10d3d9d770bbc69712b — DOI: https://doi.org/10.48550/arxiv.2507.13089
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: