May 26, 2024Open Access

在Transformer架构中解析并整合关系信息与感官信息

Key Points

Key points are not available for this paper at this time.

Abstract

Transformer架构通过实现一种神经信息传递形式来处理序列，该形式包括迭代的信息检索（注意力机制）和局部处理（位置相关的多层感知机）。在这一通用计算范式下，有两种信息至关重要：“感官”信息指个体对象的特征，“关系”信息指对象之间的关系。标准的注意力机制自然编码“感官”信息，但不显式编码“关系”信息。本文提出了一种Transformer的扩展，将多头注意力增强为两种不同类型的注意力头，分别用于传递不同类型的信息。第一种是标准的Transformer注意力机制，捕获对象级特征；第二种是我们提出的用于显式捕获关系信息的新颖注意力机制。两种注意力头各自具备不同的归纳偏差，使得所得架构更高效且更具适应性。该方法的潜力通过多项任务上的实证结果得到验证。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Altabaa等人（Sun，）研究了这个问题。

www.synapsesocial.com/papers/68e686b9b6db64358760eee2 — DOI: https://doi.org/10.48550/arxiv.2405.16727

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Authors

Awni Altabaa

John Lafferty

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

在Transformer架构中解析并整合关系信息与感官信息

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion