July 9, 2024Open Access

Mecanismo de Atenção, Transformers, BERT e GPT: Tutorial e Revisão

Key Points

Key points are not available for this paper at this time.

Abstract

Este é um artigo tutorial e de revisão sobre o mecanismo de atenção, transformers, BERT e GPT. Primeiro, explicamos o mecanismo de atenção, modelo sequência-para-sequência sem e com atenção, auto-atenção e atenção em diferentes áreas, como processamento de linguagem natural e visão computacional. Em seguida, explicamos transformers que não utilizam recorrência. Detalhamos todas as partes do codificador e decodificador no transformer, incluindo codificação posicional, auto-atenção multi-cabeça e atenção cruzada, além da atenção multi-cabeça mascarada. Após isso, apresentamos o Bidirectional Encoder Representations from Transformers (BERT) e o Generative Pre-trained Transformer (GPT) como pilhas de codificadores e decodificadores do transformer, respectivamente. Explicamos suas características e funcionamento.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Benyamin Ghojogh

Ali Ghodsi

Actions

Institutions

University of Waterloo

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Mecanismo de Atenção, Transformers, BERT e GPT: Tutorial e Revisão

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider