論文の概要: SaliencyDecor: Enhancing Neural Network Interpretability through Feature Decorrelation
- arxiv url: http://arxiv.org/abs/2604.25315v1
- Date: Tue, 28 Apr 2026 07:25:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.75664
- Title: SaliencyDecor: Enhancing Neural Network Interpretability through Feature Decorrelation
- Title(参考訳): SaliencyDecor: 機能劣化によるニューラルネットワークの解釈性向上
- Authors: Ali Karkehabadi, Jamshid Hassanpour, Houman Homayoun, Avesta Sasan,
- Abstract要約: SaliencyDecorは、Saliencyメソッドやモデルアーキテクチャを変更することなく、属性の忠実さを改善するために機能のデコレーションを強制するトレーニングフレームワークである。
提案手法は,予測性能を向上しつつ,よりシャープで,よりオブジェクト指向のサリエンシマップを生成する。
- 参考スコア(独自算出の注目度): 4.096797783087454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gradient-based saliency methods are widely used to interpret deep neural networks, yet they often produce noisy and unstable explanations that poorly align with semantically meaningful input features. We argue that a fundamental cause of this behavior lies in the geometry of learned representations: correlated feature dimensions diffuse attribution gradients across redundant directions, resulting in blurred and unreliable saliency maps. To address this issue, we identify feature correlation as a structural limitation of gradient-based interpretability and propose SaliencyDecor, a training framework that enforces feature decorrelation to improve attribution fidelity without modifying saliency methods or model architectures by reshaping the feature space toward orthogonality, our approach promotes more concentrated gradient flow and improves the fidelity of saliency-based explanations. SaliencyDecor jointly optimizes classification, prediction consistency under feature masking, and a decorrelation regularizer, requiring no architectural changes or inference-time overhead. Extensive experiments across multiple benchmarks and architectures demonstrate that our method produces substantially sharper and more object-focused saliency maps while simultaneously improving predictive performance, achieving accuracy gains across the datasets. These results establish our method as a principled mechanism for enhancing both interpretability and accuracy, challenging the conventional trade-off between explanation quality and model performance.
- Abstract(参考訳): グラディエント・ベース・サリエンシ法はディープニューラルネットワークの解釈に広く用いられているが、しばしばノイズや不安定な説明を生じさせ、意味論的に意味のある入力特徴とうまく一致しない。
この行動の根本的な原因は、学習された表現の幾何学である:相関した特徴次元は、冗長な方向にわたる帰属勾配を拡散させ、その結果、曖昧で信頼性の低い従属写像をもたらす。
この問題に対処するため,我々は,特徴相関を勾配に基づく解釈可能性の構造的制限として認識し,直交性に対する特徴空間の変形による帰属法やモデルアーキテクチャの変更を伴わずに,帰属の忠実性を改善するための特徴デコレーションを強制する訓練フレームワークであるSaliencyDecorを提案する。
SaliencyDecorは、分類、フィーチャーマスキングによる予測一貫性、デコリレーションレギュレータを共同で最適化し、アーキテクチャの変更や推論時のオーバーヘッドを必要としない。
複数のベンチマークやアーキテクチャにわたる大規模な実験により、我々の手法は、予測性能を同時に改善し、データセット全体の精度向上を達成するとともに、よりシャープで、よりオブジェクト中心のサリエンシマップを生成することが示された。
これらの結果は,従来の説明品質とモデル性能のトレードオフに挑戦し,解釈可能性と精度を両立させる原理的なメカニズムとして,本手法を確立した。
関連論文リスト
- Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている
既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。
トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文 参考訳(メタデータ) (2026-01-25T07:09:20Z) - Semantic-guided Fine-tuning of Foundation Model for Long-tailed Visual Recognition [38.74388860692423]
長期視覚認識のための基礎モデルのセマンティック誘導微調整法(セージ)を提案する。
クラス記述をセマンティックガイダンスとして統合したSG-Adapterを導入し,ビジュアルエンコーダの微調整を指導する。
ベンチマークデータセットの実験は、長期学習におけるパフォーマンス向上における提案されたSageの有効性を示す。
論文 参考訳(メタデータ) (2025-07-17T05:47:19Z) - Structured Convergence in Large Language Model Representations via Hierarchical Latent Space Folding [0.0]
高次元潜在空間におけるトークン表現は、しばしば冗長性を示し、計算効率を制限し、モデル層全体の構造的コヒーレンスを低減する。
本稿では,学習した埋め込みにおいて,マルチスケールの組織を強制する構造的変換機構を提案する。
経験的評価は、層間の表現分散の減少を示し、より安定したパープレキシティ分布に寄与し、テキスト生成における予測信頼性を高める。
論文 参考訳(メタデータ) (2025-02-13T04:01:54Z) - Contextually Entangled Gradient Mapping for Optimized LLM Comprehension [0.0]
Entually Entangled Gradient Mapping (CEGM)は、勾配最適化に対する新しいアプローチを導入する。
勾配を分離された数値エンティティではなく、コンテキスト依存の動的キャリアとして扱う。
提案手法は,既存の最適化戦略において重要なギャップを埋めるものである。
論文 参考訳(メタデータ) (2025-01-28T11:50:35Z) - Unlearning-based Neural Interpretations [51.99182464831169]
静的関数を用いて定義される現在のベースラインは、バイアスがあり、脆弱であり、操作可能であることを示す。
UNIは、学習不可能で、偏りがなく、適応的なベースラインを計算し、入力を最も急な上昇の未学習方向に向けて摂動させることを提案する。
論文 参考訳(メタデータ) (2024-10-10T16:02:39Z) - Improving Network Interpretability via Explanation Consistency Evaluation [56.14036428778861]
本稿では、より説明可能なアクティベーションヒートマップを取得し、同時にモデル性能を向上させるフレームワークを提案する。
具体的には、モデル学習において、トレーニングサンプルを適応的に重み付けするために、新しいメトリクス、すなわち説明整合性を導入する。
そこで,本フレームワークは,これらのトレーニングサンプルに深い注意を払ってモデル学習を促進する。
論文 参考訳(メタデータ) (2024-08-08T17:20:08Z) - Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent
Signals: Application to Hyperspectral Imaging [71.57324258813675]
相互依存信号のデータセットは、列が強い依存を示す行列として定義される。
ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。
ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文 参考訳(メタデータ) (2022-03-29T21:00:39Z) - Rethinking Skip Connection with Layer Normalization in Transformers and
ResNets [49.87919454950763]
スキップ接続は、ディープニューラルネットワークの性能を改善するために広く使われているテクニックである。
本研究では,スキップ接続の有効性におけるスケール要因について検討する。
論文 参考訳(メタデータ) (2021-05-15T11:44:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。