Key points are not available for this paper at this time.
本論文では、新しいトークン選択型注意アプローチであるToSAを提案します。これは、注意を要するトークンとトランスフォーマーレイヤーをスキップできるトークンを識別できます。具体的には、トークンセレクターが現在の注意マップを解析し、次の層の注意マップを予測します。これらは次に注意操作に参加すべき重要なトークンを選択するために使用されます。残りのトークンは単に次の層をバイパスし、注意されたトークンと連結されて完全なトークンセットを再形成します。これにより、より少ないトークンが自己注意に参加するため二次的な計算およびメモリコストが削減されつつ、ネットワーク全体で全画像パッチの特徴を維持でき、密な予測タスクへの適用が可能となります。実験により、ToSAを適用することでImageNet分類ベンチマークにおいて計算コストを大幅に削減しつつ精度を維持できることを示しました。さらに、NYU Depth V2の単眼深度推定という密な予測タスクで評価し、ToSAを用いることではるかに軽量なバックボーンで同等の深度推定精度を達成できることを示しました。
Building similarity graph...
Analyzing shared references across papers
Loading...
Manish Kumar Singh
Rajeev Yasarla
Hong Cai
Building similarity graph...
Analyzing shared references across papers
Loading...
Singhら(Thu,)はこの問題を研究しました。
www.synapsesocial.com/papers/68e64f83b6db6435875e0000 — DOI: https://doi.org/10.48550/arxiv.2406.08816
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: