What type of study is this?

This is a Literature Review study.

October 2, 2025Open Access

Compressão de Tokens Encontra Vision Transformers Compactos: Uma Pesquisa e Avaliação Comparativa para Edge AI

Key Points

A compressão de tokens melhora a taxa de inferência em vision transformers, mas tem dificuldades com designs compactos.
Avaliações de benchmark indicam que métodos de compressão são menos eficazes em vision transformers compactos do que em modelos padrão.
Taxonomia sistemática de estratégias de compressão de tokens revela abordagens essenciais como pruning e merging em configurações de implantação.
As descobertas fornecem insights para otimizar técnicas de tokens em dispositivos edge com recursos limitados, orientando pesquisas futuras.

Abstract

Técnicas de compressão de tokens emergiram recentemente como ferramentas poderosas para acelerar a inferência de Vision Transformer (ViT) em visão computacional. Devido à complexidade computacional quadrática em relação ao comprimento da sequência de tokens, esses métodos visam remover tokens menos informativos antes das camadas de atenção para melhorar a taxa de inferência. Embora numerosos estudos tenham explorado vários trade-offs entre precisão e eficiência em ViTs de grande escala, duas lacunas críticas permanecem. Primeiro, existe a falta de uma pesquisa unificada que categorize e compare sistematicamente abordagens de compressão de tokens com base em suas estratégias principais (por exemplo, pruning, merging ou híbrida) e configurações de implantação (por exemplo, fine-tuning vs. plug-in). Segundo, a maioria dos benchmarks é limitada a modelos ViT padrão (por exemplo, ViT-B, ViT-L), deixando em aberto a questão de saber se tais métodos permanecem eficazes quando aplicados a transformers estruturalmente comprimidos, que são cada vez mais implantados em dispositivos edge com recursos limitados. Para abordar essas lacunas, apresentamos a primeira taxonomia sistemática e estudo comparativo de métodos de compressão de tokens, e avaliamos técnicas representativas em arquiteturas ViT padrão e compactas. Nossos experimentos revelam que, embora os métodos de compressão de tokens sejam eficazes para ViTs de uso geral, eles frequentemente têm desempenho inferior quando aplicados diretamente a designs compactos. Essas descobertas não apenas fornecem insights práticos, mas também abrem o caminho para pesquisas futuras na adaptação de técnicas de otimização de tokens para redes baseadas em transformers compactos para aplicações de Edge AI e agentes de IA.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Phat Nguyen

Ngai‐Man Cheung

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Compressão de Tokens Encontra Vision Transformers Compactos: Uma Pesquisa e Avaliação Comparativa para Edge AI

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider