What type of study is this?

This is a Quantitative Study study.

October 10, 2025Open Access

Décomposer l'attention pour trouver des neurones sensibles au contexte

Key Points

Les neurones dans la première couche des modèles transformeurs peuvent répondre efficacement aux propriétés sensibles au contexte.
L’échantillonnage des dénominateurs softmax à partir d’un texte de calibration permet des insights significatifs sur l’activation neuronale.
Les scores d'attention de certains neurones restent stables lorsque la distribution des jetons est fixée, permettant une meilleure analyse.
La méthode approxime les sorties en combinant efficacement les informations de plusieurs têtes d’attention stables.

Abstract

Nous étudions les modèles de langue transformeurs, en analysant les têtes d'attention dont les schémas d'attention sont dispersés, et dont les scores d'attention dépendent faiblement du contenu. Nous soutenons que les dénominateurs softmax de ces têtes sont stables lorsque la distribution sous-jacente des jetons est fixée. En échantillonnant les dénominateurs softmax à partir d'un "texte de calibration", nous pouvons combiner les sorties de plusieurs de ces têtes stables dans la première couche de GPT2-Small, en approximant leur sortie combinée par un résumé linéaire du texte environnant. Cette approximation permet une procédure où, à partir des poids seuls - et d’un seul texte de calibration - nous pouvons découvrir des centaines de neurones de la première couche qui répondent aux propriétés contextuelles de haut niveau du texte environnant, y compris des neurones qui ne s'activaient pas sur le texte de calibration.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Alex Gibson

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Décomposer l'attention pour trouver des neurones sensibles au contexte

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study