論文の概要: AIM: Adversarial Information Masking for Faithfulness Evaluation of Saliency Maps
- arxiv url: http://arxiv.org/abs/2605.16905v1
- Date: Sat, 16 May 2026 09:36:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.230747
- Title: AIM: Adversarial Information Masking for Faithfulness Evaluation of Saliency Maps
- Title(参考訳): AIM:サリエンシマップの忠実度評価のための敵対情報マスキング
- Authors: Chia-Ying Hsieh, Hsin-Yuan Fang, Chun-Shu Wei,
- Abstract要約: ポストホックサリエンシ法はディープニューラルネットワークの解釈に広く用いられている。
既存の評価では、サリエンシによって引き起こされる特徴の順序と性能劣化を測定する。
本稿では,サリエンシマップの忠実度とマスキング操作者の信頼性の両方を評価するために,サリエンシ誘導型機能代替フレームワークであるAdrial Information Masking (AIM)を提案する。
- 参考スコア(独自算出の注目度): 0.9940728137241214
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Post-hoc saliency methods are widely used to interpret deep neural networks, but their faithfulness is difficult to evaluate reliably. Existing evaluations mask features according to saliency-induced feature ordering and measure performance degradation, but this degradation can be confounded by the masking operator: zero masking may create out-of-distribution artifacts, while interpolation-based masking may preserve residual predictive information. We propose Adversarial Information Masking (AIM), a saliency-guided adversarial feature replacement framework for evaluating both saliency-map faithfulness and masking-operator reliability. AIM replaces selected features with values from an adversarial counterpart of the input and compares degradation under complementary masking orders. We assess reliability using random-attribution bias and stability of explanation-method faithfulness rankings. Experiments on image, audio, and EEG tasks suggest that AIM reduces masking-induced bias compared with zero and interpolation-based masking, while revealing modality-dependent differences between signed and unsigned attributions.
- Abstract(参考訳): ポストホックサリエンシ法はディープニューラルネットワークの解釈に広く用いられているが、その忠実さを確実に評価することは困難である。
既存の評価では、サリエンシによって引き起こされた特徴の順序と性能劣化の測定によってマスクの特徴が評価されているが、この劣化はマスキングオペレーターによって、ゼロマスキングがアウト・オブ・ディストリビューション・アーティファクトを生成する一方で、補間ベースのマスキングは残留予測情報を保持できる。
本稿では,サリエンシマップの忠実度とマスキング操作者の信頼性の両方を評価するために,サリエンシ誘導型機能代替フレームワークであるAdversarial Information Masking (AIM)を提案する。
AIMは選択した特徴を、入力の逆の値に置き換え、補完的なマスキング順序の下での劣化を比較する。
ランダム属性バイアスと説明メソッド忠実度ランキングの安定性を用いて信頼性を評価する。
画像、音声、脳波のタスクの実験は、AIMがマスクによる偏見をゼロや補間に基づくマスキングと比較して低減し、符号付きと符号なしの属性間のモダリティ依存性の違いを明らかにすることを示唆している。
関連論文リスト
- CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - Impute-MACFM: Imputation based on Mask-Aware Flow Matching [1.9483189922830135]
Impute-MACFMは、表計算のための条件付きフローマッチングフレームワークである。
無作為性、無作為性、無作為性、無作為性、無作為性に対処する。
軌道は欠落したエントリのみに設定され、予測速度は観測されたエントリでほぼゼロに抑えられる。
論文 参考訳(メタデータ) (2025-09-27T05:15:09Z) - AIM: Amending Inherent Interpretability via Self-Supervised Masking [57.17600766859953]
自己スーパーバイザード・マスキング(AIM)によるインテリジェント・インタプリタビリティの向上について提案する。
AIMは、追加のアノテーションを必要とせずに、刺激的な代替品よりも真の機能の利用を促進する。
我々は、分布外一般化ときめ細かい視覚的理解の両方をテストする、さまざまな挑戦的なデータセットでAIMを検証する。
論文 参考訳(メタデータ) (2025-08-15T14:29:59Z) - DynaNoise: Dynamic Probabilistic Noise Injection for Defending Against Membership Inference Attacks [6.610581923321801]
会員推論攻撃(MIA)は、トレーニングデータセットのプライバシーに重大なリスクをもたらす。
従来の緩和技術は、トレーニングや推論中に一定量のノイズを注入することに依存している。
問合せ感度に基づいて動的にノイズ注入を変調する適応型アプローチであるDynaNoiseを提案する。
論文 参考訳(メタデータ) (2025-05-19T17:07:00Z) - ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation [91.20492150248106]
本研究では,不誠実な生成の背後にある内部メカニズムを解明し,不均等に活性化される中深度フィードフォワードネットワーク(FFN)のサブセットを同定する。
本研究では,不信感関連FFNの活性化を抑制することにより,文脈的忠実度を向上させるフレームワークであるParametric Knowledge Mutingを提案する。
実験結果から,ParamMuteはCoFaithfulQAと確立されたConFiQAベンチマークの両方の信頼度を大幅に向上し,パラメトリックメモリへの依存度を大幅に低下させることが示された。
論文 参考訳(メタデータ) (2025-02-21T15:50:41Z) - dugMatting: Decomposed-Uncertainty-Guided Matting [83.71273621169404]
そこで本稿では, 明確に分解された不確かさを探索し, 効率よく効率よく改善する, 分解不確実性誘導型マッチングアルゴリズムを提案する。
提案したマッチングフレームワークは,シンプルで効率的なラベリングを用いて対話領域を決定する必要性を緩和する。
論文 参考訳(メタデータ) (2023-06-02T11:19:50Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z) - Reliable Probabilistic Face Embeddings in the Wild [5.094757968178221]
PFE(probabilistic Face Embeddings)は、制約のないシナリオにおける顔認識性能を改善する。
PFE法は不確実性を推定するのに過信であり、大規模な顔マッチングに適用するには遅すぎる。
本稿では,PFEのロバスト性および速度を改善するために,正規化確率的顔埋め込み法を提案する。
論文 参考訳(メタデータ) (2021-02-08T09:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。