論文の概要: Feature Attribution Stability Suite: How Stable Are Post-Hoc Attributions?
- arxiv url: http://arxiv.org/abs/2604.02532v1
- Date: Thu, 02 Apr 2026 21:32:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.214697
- Title: Feature Attribution Stability Suite: How Stable Are Post-Hoc Attributions?
- Title(参考訳): 機能属性安定性スイート: ポストホック属性はどの程度安定か?
- Authors: Kamalasankari Subramaniakuppusamy, Jugal Gajjar,
- Abstract要約: ポストホック特徴属性法は、安全クリティカルな視覚システムに広く展開されている。
本稿では,予測不変フィルタのベンチマークであるFeature Stability Suite (FASS)を紹介する。
FASSは安定性を,構造的類似性,ランク相関,トップkのJaccardオーバーラップという,3つの相補的な指標に分解する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Post-hoc feature attribution methods are widely deployed in safety-critical vision systems, yet their stability under realistic input perturbations remains poorly characterized. Existing metrics evaluate explanations primarily under additive noise, collapse stability to a single scalar, and fail to condition on prediction preservation, conflating explanation fragility with model sensitivity. We introduce the Feature Attribution Stability Suite (FASS), a benchmark that enforces prediction-invariance filtering, decomposes stability into three complementary metrics: structural similarity, rank correlation, and top-k Jaccard overlap-and evaluates across geometric, photometric, and compression perturbations. Evaluating four attribution methods (Integrated Gradients, GradientSHAP, Grad-CAM, LIME) across four architectures and three datasets-ImageNet-1K, MS COCO, and CIFAR-10, FASS shows that stability estimates depend critically on perturbation family and prediction-invariance filtering. Geometric perturbations expose substantially greater attribution instability than photometric changes, and without conditioning on prediction preservation, up to 99% of evaluated pairs involve changed predictions. Under this controlled evaluation, we observe consistent method-level trends, with Grad-CAM achieving the highest stability across datasets.
- Abstract(参考訳): ポストホック特徴帰属法は、安全クリティカルな視覚システムに広く展開されているが、現実的な入力摂動下での安定性はいまだに不十分である。
既存の指標では, 主に付加雑音下での説明評価, 単一スカラーの崩壊安定性, 予測保存の条件付けに失敗し, モデル感度と説明脆弱性を混同している。
本稿では,予測不変フィルタリングを施行するベンチマークであるFeature Attribution Stability Suite (FASS)を紹介し,安定性を3つの相補的指標(構造的類似性,ランク相関,トップkジャカード重なり合い)に分解し,幾何学的,測光的,圧縮的摂動にまたがって評価する。
Integrated Gradients, GradientSHAP, Grad-CAM, LIME) を4つのアーキテクチャと3つのデータセット (ImageNet-1K, MS COCO, CIFAR-10) で評価した結果, 安定性推定は摂動系と予測不変フィルタに大きく依存していることが判明した。
幾何学的摂動は、光度変化よりもかなり大きな帰属不安定を示し、予測保存を条件にしなければ、評価されたペアの99%は、変化した予測を含む。
この制御された評価の下では、Grad-CAMがデータセット間で最高の安定性を達成し、一貫したメソッドレベルのトレンドを観察する。
関連論文リスト
- SAIF: A Stability-Aware Inference Framework for Medical Image Segmentation with Segment Anything Model [11.410993498576936]
Segment Anything Model (SAM)は、スケーラブルな医療画像セグメンテーションを可能にするが、フリーズバックボーンとしてデプロイされた場合、推論時の不安定さに悩まされる。
本研究では,プロンプトとしきい値の不確実性を明示的にモデル化し,ロバスト性を向上させるためのトレーニングフリーかつプラグアンドプレイ型推論フレームワークであるStable-Aware Inference Framework (SAIF)を提案する。
論文 参考訳(メタデータ) (2026-03-13T19:15:34Z) - Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems [3.8615905456206256]
本稿では,説明安定度(CIES)による信頼度指数(Credibility Index)について紹介する。
CIESは、予測自体だけでなく、予測の背後にある理由が一貫しているかどうかをキャプチャする。
その結果、モデル複雑性は説明信頼性に影響を与え、SMOTEによるクラス不均衡処理は予測性能だけでなく、説明安定性にも影響を及ぼすことが示された。
論文 参考訳(メタデータ) (2026-03-05T10:11:55Z) - On the Structural Non-Preservation of Epistemic Behaviour under Policy Transformation [51.56484100374058]
このような情報条件の相互作用パターンを振る舞い依存として定式化する。
これにより、$$-behavioural equivalenceというプローブ相対的な概念と、政治内行動距離が導かれる。
その結果、共通政策変換の下でプローブ条件の挙動分離が保存されない構造条件が明らかになった。
論文 参考訳(メタデータ) (2026-02-24T22:55:21Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Geometric Stability: The Missing Axis of Representations [0.0]
我々は$geometric$ $stabilityを導入し、摂動下での表現幾何学の信頼性を定量化する。
7つの領域における2,463以上の構成から、安定性と類似性は実証的に非相関性を示す。
安全監視のため、安定性は機能的な幾何学的カナリアとして機能し、CKAよりも2ドル近い速度で構造的なドリフトを検出する。
モデル選択においては、安定性は転送可能性から解離し、転送最適化が生じる幾何学的税制を明らかにする。
論文 参考訳(メタデータ) (2026-01-14T05:15:22Z) - MaP: A Unified Framework for Reliable Evaluation of Pre-training Dynamics [72.00014675808228]
大規模言語モデルの不安定性評価プロセスは、真の学習力学を曖昧にする。
textbfMaPは、アンダーラインMergingアンダーラインとアンダーラインPass@kメトリックを統合するフレームワークです。
実験により、MaPはよりスムーズな性能曲線を示し、ラン間分散を低減し、より一貫性のあるランキングを保証する。
論文 参考訳(メタデータ) (2025-10-10T11:40:27Z) - Stable Update of Regression Trees [0.0]
本稿では,回帰木という,本質的に説明可能な機械学習手法の安定性に着目した。
本稿では,初期モデルの不確実性に基づいてデータポイントを重み付けする正規化手法を提案する。
その結果、提案手法は、類似またはより良い予測性能を達成しつつ、安定性の向上を図っている。
論文 参考訳(メタデータ) (2024-02-21T09:41:56Z) - Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。
信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文 参考訳(メタデータ) (2023-01-25T19:35:23Z) - Evaluating probabilistic classifiers: Reliability diagrams and score
decompositions revisited [68.8204255655161]
確率的に統計的に一貫性があり、最適に結合し、再現可能な信頼性図を自動生成するCORP手法を導入する。
コーパスは非パラメトリックアイソトニック回帰に基づいており、プール・アジャセント・ヴァイオレータ(PAV)アルゴリズムによって実装されている。
論文 参考訳(メタデータ) (2020-08-07T08:22:26Z) - Fine-Grained Analysis of Stability and Generalization for Stochastic
Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。
これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。
我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文 参考訳(メタデータ) (2020-06-15T06:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。