Apresentamos um marco unificado para a interpretabilidade e segurança de transformers fundamentado na geometria dos operadores de fluxo residual – diferenças intercamadas Δl = hl+1 − hl que capturam diretamente o que cada camada contribui para a passagem direta. Fazemos cinco contribuições empíricas validadas em quatro modelos abrangendo três famílias arquitetônicas e uma faixa de parâmetros de 80× (GPT-2 117M até Qwen3.5-9B).
Building similarity graph...
Analyzing shared references across papers
Loading...
Sanskar Pandey
Building similarity graph...
Analyzing shared references across papers
Loading...
Sanskar Pandey (sex,) estudou esta questão.
www.synapsesocial.com/papers/69bf393dc7b3c90b18b43bb2 — DOI: https://doi.org/10.5281/zenodo.19135348
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: