論文の概要: XtrAIn: Training-Guided Occlusion for Feature Attribution
- arxiv url: http://arxiv.org/abs/2606.10877v1
- Date: Tue, 09 Jun 2026 13:52:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.53266
- Title: XtrAIn: Training-Guided Occlusion for Feature Attribution
- Title(参考訳): XtrAIn: 特徴属性のためのトレーニングガイドオクルージョン
- Authors: Thodoris Lymperopoulos, Ioannis Kakogeorgiou, Denia Kanellopoulou,
- Abstract要約: Occlusion-based Attribution Methodは、入力特徴を摂動させ、結果のモデル出力の変化を測定することにより、特徴の重要度を推定することができる。
本稿では,入力空間からパラメータ空間へのオクルージョン操作を伝達する学習誘導帰属法であるXtrAInを紹介する。
XtrAInは標準的な属性ベースラインよりもクリーンで解釈可能な属性パターンを生成する。
- 参考スコア(独自算出の注目度): 3.3609128464006015
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Occlusion-based attribution methods provide an intuitive way to estimate feature importance by perturbing input features and measuring the resulting change in model output. However, their reliability is strongly affected by how feature removal is implemented: externally selected baselines can introduce bias, out-of-distribution samples, and unstable explanations, while in nonlinear models the occlusion of a set of features can also alter the contribution of non-occluded features. We refer to this effect as attribution shift, as the attribution scores of the non-occluded features drift from their initial values. To challenge these major issues that render explanations unstable, we introduce XtrAIn, a training-guided attribution method that transfers the occlusion operation from the input space to the parameter space. Instead of replacing input values with hand-crafted baselines, XtrAIn follows the model's training trajectory and measures how feature-associated parameter updates affect the output logits. We further introduce Xstep, a lightweight approximation for reducing computational cost, and XtrAIn+, a target-focused variant that emphasizes updates aligned with the target class. Experiments on controlled image datasets and PAM50 breast-cancer subtype classification show that the proposed methods produce cleaner and more interpretable attribution patterns than standard attribution baselines. Overall, XtrAIn provides a training-aware perspective on feature attribution and offers a useful diagnostic tool for studying how feature-level evidence is formed during training.
- Abstract(参考訳): Occlusion-based Attribution Methodは、入力特徴を摂動させ、結果のモデル出力の変化を測定することによって、特徴の重要度を推定する直感的な方法を提供する。
外部選択されたベースラインはバイアス、分布外サンプル、不安定な説明を導入でき、非線形モデルでは、一連の特徴の閉塞は非閉塞的特徴の寄与を変える。
この効果を帰属シフト(Atribution shift)と呼び、非排他的特徴の帰属スコアが初期値からドリフトする。
説明が不安定なこれらの主要な問題に対処するために,入力空間からパラメータ空間へのオクルージョン操作を伝達するトレーニング誘導帰属法であるXtrAInを導入する。
入力値を手作りのベースラインに置き換える代わりに、XtrAInはモデルのトレーニング軌道に従い、特徴関連パラメータ更新が出力ロジットにどのように影響するかを測定する。
さらに、計算コストを削減する軽量な近似であるXstepと、対象クラスと整合した更新を強調するターゲット中心の変種であるXtrAIn+についても紹介する。
制御された画像データセットとPAM50乳がんサブタイプ分類の実験により,提案手法は標準属性ベースラインよりもクリーンで解釈可能な属性パターンを生成することが示された。
全体として、XtrAInは、機能属性に関するトレーニング対応の視点を提供し、トレーニング中に機能レベルのエビデンスがどのように形成されるかを研究するための有用な診断ツールを提供する。
関連論文リスト
- Learn to Rank: Visual Attribution by Learning Importance Ranking [58.69028273772474]
コンピュータビジョンモデルのための視覚属性マップを生成する新しい手法を提案する。
提案手法は, 任意の数段階の勾配補正を施した1つの前方通過において, 密度の高い画素レベルの属性を生成する。
我々の実験は、一貫した定量的改善と、よりシャープで境界に沿った説明を示す。
論文 参考訳(メタデータ) (2026-04-07T12:53:22Z) - HSFM: Hard-Set-Guided Feature-Space Meta-Learning for Robust Classification under Spurious Correlations [25.503211313768062]
本稿では,特徴空間で直接拡張を行う二段階メタラーニング手法を提案する。
ピクセル空間ではなくバックボーン出力で操作することで、この手法は非常に効率的で安定であり、1つのGPUで数分のトレーニングしか必要としない。
論文 参考訳(メタデータ) (2026-03-31T06:32:56Z) - Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - Distributional Training Data Attribution: What do Influence Functions Sample? [25.257922996567178]
分散学習データ属性(d-TDA)を導入する。
d-TDAの目標は、モデル出力の分布がデータセットに依存するかを予測することである。
影響関数 (IF) は「秘密分布」である。
論文 参考訳(メタデータ) (2025-06-15T21:02:36Z) - Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
これらの課題に対処するための影響関数フレームワークを開発する。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Explainability of Machine Learning Models under Missing Data [3.0485328005356136]
データ不足は、モデルのパフォーマンスと説明容易性を著しく損なうおそれのある問題である。
本稿では、欠落データ分野の発展を要約し、SHAPに対する様々な計算方法の効果について考察する。
論文 参考訳(メタデータ) (2024-06-29T11:31:09Z) - Data augmentation and explainability for bias discovery and mitigation
in deep learning [0.0]
この論文は、ディープニューラルネットワークにおけるバイアスの影響を調査し、モデルパフォーマンスへの影響を減らす方法を提案する。
最初の部分は、データやモデルのバイアスやエラーの潜在的な原因を分類し、記述することから始まり、特に機械学習パイプラインのバイアスに焦点を当てている。
次の章では、予測と制御を正当化し、モデルを改善する手段として、説明可能なAIの分類と方法について概説する。
論文 参考訳(メタデータ) (2023-08-18T11:02:27Z) - Certifying Model Accuracy under Distribution Shifts [151.67113334248464]
本稿では,データ分布の有界ワッサースタインシフトの下でのモデルの精度について,証明可能なロバスト性保証を提案する。
変換空間におけるモデルの入力をランダム化する単純な手順は、変換の下での分布シフトに対して確実に堅牢であることを示す。
論文 参考訳(メタデータ) (2022-01-28T22:03:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。