February 23, 2024Open Access

Transformers: Statistische Interpretation, Architekturen und Anwendungen

Key Points

Key points are not available for this paper at this time.

Abstract

Transformers werden weithin als leistungsstarke Werkzeuge zur Analyse multipler Aufgaben anerkannt, dank ihrer hochmodernen Multi-Head-Attention-Räume, beispielsweise in der natürlichen Sprachverarbeitung (NLP), Computer Vision (CV) und Spracherkennung (SR). Inspiriert von ihren vielfältigen Designs und starken Funktionen bei der Analyse von Eingabedaten, möchten wir mit den verschiedenen Architekturen beginnen, anschließend die Untersuchung ihres statistischen Mechanismus und der Inferenz vornehmen und schließlich ihre Anwendungen bei dominanten Aufgaben vorstellen. Die zugrunde liegenden statistischen Mechanismen wecken unser Interesse und verleiten uns dazu, sie auf einer höheren Ebene zu erforschen. Diese Übersicht konzentriert sich daher auf die mathematischen Grundlagen und nutzt diese Prinzipien, um die Gründe für ihre hervorragende Leistung in vielen Erkennungsszenarien zu analysieren.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Fanfei Meng

Yuxin Wang

Journals

Applied and Computational Engineering

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Transformers: Statistische Interpretation, Architekturen und Anwendungen

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study