論文の概要: Decision-Aware Attention Propagation for Vision Transformer Explainability
- arxiv url: http://arxiv.org/abs/2604.18094v1
- Date: Mon, 20 Apr 2026 11:10:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.827042
- Title: Decision-Aware Attention Propagation for Vision Transformer Explainability
- Title(参考訳): 視覚変換器説明可能性のための決定型注意伝播
- Authors: Sehyeong Jo, Gangjae Jang, Haesol Park,
- Abstract要約: DAP(Decision-Aware Attention Propagation)は、意思決定に関連する事前情報をトランスフォーマーの注意伝達に注入する属性法である。
DAPは従来の注意に基づく手法よりもクラス敏感でコンパクトで忠実な帰属写像を生成する。
- 参考スコア(独自算出の注目度): 1.9116784879310027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision Transformers (ViTs) have become a dominant architecture in computer vision, yet their prediction process remains difficult to interpret because information is propagated through complex interactions across layers and attention heads. Existing attention based explanation methods provide an intuitive way to trace information flow. However, they rely mainly on raw attention weights, which do not explicitly reflect the final decision and often lead to explanations with limited class discriminability. In contrast, gradient based localization methods are more effective at highlighting class specific evidence, but they do not fully exploit the hierarchical attention propagation mechanism of transformers. To address this limitation, we propose Decision-Aware Attention Propagation (DAP), an attribution method that injects decision-relevant priors into transformer attention propagation. By estimating token importance through gradient based localization and integrating it into layer wise attention rollout, the method captures both the structural flow of attention and the evidence most relevant to the final prediction. Consequently, DAP produces attribution maps that are more class sensitive, compact, and faithful than those generated by conventional attention based methods. Extensive experiments across Vision Transformer variants of different model scales show that DAP consistently outperforms existing baselines in both quantitative metrics and qualitative visualizations, indicating that decision aware propagation is an effective direction for improving ViT interpretability.
- Abstract(参考訳): 視覚変換器(ViT)はコンピュータビジョンにおいて支配的なアーキテクチャとなっているが、情報層や注目ヘッド間の複雑な相互作用によって伝達されるため、その予測プロセスの解釈は困難である。
既存の注意に基づく説明手法は、情報の流れを追跡する直感的な方法を提供する。
しかし、それらは主に生の注意重みに依存しており、これは最終的な決定を明示的に反映せず、しばしば階級差別性に制限された説明につながる。
対照的に、勾配に基づく局所化法は、クラス固有の証拠を強調するのに効果的であるが、それらはトランスの階層的注意伝播機構を完全に活用していない。
この制限に対処するために、意思決定関連先行情報をトランスフォーマーの注意伝達に注入する帰属法であるDAP(Decision-Aware Attention Propagation)を提案する。
勾配に基づく局所化を通じてトークンの重要度を推定し,それを階層的注意ロールアウトに統合することにより,注目の構造フローと最終予測に最も関係のある証拠の両方をキャプチャする。
その結果、DAPは従来の注意に基づく手法よりもクラス敏感でコンパクトで忠実な帰属写像を生成する。
異なるモデルスケールのVision Transformer変種にわたる広範囲な実験により、DAPは定量的メトリクスと定性的視覚化の両方において既存のベースラインを一貫して上回り、意思決定意識の伝播がViT解釈性を改善する効果的な方向であることを示している。
関連論文リスト
- Learn to Rank: Visual Attribution by Learning Importance Ranking [58.69028273772474]
コンピュータビジョンモデルのための視覚属性マップを生成する新しい手法を提案する。
提案手法は, 任意の数段階の勾配補正を施した1つの前方通過において, 密度の高い画素レベルの属性を生成する。
我々の実験は、一貫した定量的改善と、よりシャープで境界に沿った説明を示す。
論文 参考訳(メタデータ) (2026-04-07T12:53:22Z) - Where and How to Perturb: On the Design of Perturbation Guidance in Diffusion and Flow Models [48.385105851598745]
ヘードハンター(HeadHunter)は、ユーザ中心の目標に合わせた注意点を反復的に選択するための体系的なフレームワークである。
ソフトパグ(SoftPAG)は、摂動強度を調整し、アーティファクトを抑える連続したノブである。
大規模なDiTベースのテキスト・ツー・イメージ・モデルに対して,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2025-06-12T17:59:51Z) - DAPE V2: Process Attention Score as Feature Map for Length Extrapolation [63.87956583202729]
我々は特徴写像としての注意を概念化し、コンピュータビジョンにおける処理方法を模倣するために畳み込み演算子を適用した。
様々な注意関係のモデルに適応できる新しい洞察は、現在のTransformerアーキテクチャがさらなる進化の可能性があることを示している。
論文 参考訳(メタデータ) (2024-10-07T07:21:49Z) - Noise-Free Explanation for Driving Action Prediction [11.330363757618379]
我々は, この欠陥を解消するための, 実装が容易だが効果的な方法を提案する: 平滑な騒音ノルム注意(SNNA)
変換された値ベクトルのノルムで注意を重み付け、アテンション勾配でラベル固有の信号を誘導し、入力摂動をランダムにサンプリングし、対応する勾配を平均化し、ノイズのない属性を生成する。
定性的かつ定量的な評価結果は、より明確な視覚的説明図を作成し、入力画素の重要度をランク付けする他のSOTA注意に基づく説明可能な方法と比較して、SNNAの優位性を示している。
論文 参考訳(メタデータ) (2024-07-08T19:21:24Z) - Visualizing Transferred Knowledge: An Interpretive Model of Unsupervised
Domain Adaptation [70.85686267987744]
教師なしのドメイン適応問題は、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送することができる。
本稿では、翻訳された知識の謎を視覚的に明らかにする最初の試みとして、教師なしドメイン適応の解釈モデルを提案する。
提案手法は,ベースモデルの予測を直感的に説明し,画像パッチをソースドメインとターゲットドメインの両方で同一のセマンティクスとマッチングすることで伝達知識を公開する。
論文 参考訳(メタデータ) (2023-03-04T03:02:12Z) - XAI for Transformers: Better Explanations through Conservative
Propagation [60.67748036747221]
変換器の勾配は局所的にのみ関数を反映しており、入力特徴の予測への寄与を確実に識別できないことを示す。
我々の提案は、よく確立されたLPP法のトランスフォーマーへの適切な拡張と見なすことができる。
論文 参考訳(メタデータ) (2022-02-15T10:47:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。