March 4, 2024Open Access

NiNformer: Um Transformer Network in Network com Função de Gating Gerada por Mistura de Tokens

Key Points

Key points are not available for this paper at this time.

Abstract

O mecanismo de Atenção é o principal componente da arquitetura Transformer e, desde sua introdução, tem levado a avanços significativos em Deep Learning que abrangem muitos domínios e múltiplas tarefas. O Mecanismo de Atenção foi utilizado em Visão Computacional como o Vision Transformer ViT, e seu uso se expandiu para muitas tarefas no domínio da visão, como classificação, segmentação, detecção de objetos e geração de imagens. Embora esse mecanismo seja muito expressivo e capaz, ele possui a desvantagem de ser computacionalmente caro e requerer conjuntos de dados de tamanho considerável para otimização eficaz. Para resolver essas limitações, muitos designs foram propostos na literatura para reduzir a carga computacional e aliviar os requisitos de tamanho dos dados. Exemplos dessas tentativas no domínio da visão são o MLP-Mixer, o Conv-Mixer, o Perciver-IO e muitos mais. Este artigo apresenta um novo bloco computacional como alternativa ao bloco ViT padrão que reduz os encargos computacionais substituindo as camadas normais de Atenção por uma estrutura Network in Network que aprimora a abordagem estática do MLP Mixer com um sistema dinâmico de aprendizado de uma função element-wise de gating por meio de um processo de mistura de tokens. Experimentações extensivas mostram que o design proposto oferece melhor desempenho que as arquiteturas base em múltiplos conjuntos de dados aplicados na tarefa de classificação de imagens no domínio da visão.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Abdullah Nazhat Abdullah

Tarkan Aydın

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

NiNformer: Um Transformer Network in Network com Função de Gating Gerada por Mistura de Tokens

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider