論文の概要: Manifold-Aligned Guided Integrated Gradients for Reliable Feature Attribution
- arxiv url: http://arxiv.org/abs/2605.02167v1
- Date: Mon, 04 May 2026 02:56:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.115221
- Title: Manifold-Aligned Guided Integrated Gradients for Reliable Feature Attribution
- Title(参考訳): 信頼性のある特徴属性のためのマニフォールドアライメント誘導積分勾配
- Authors: Soyeon Kim, Seongwoo Lim, Kyowoon Lee, Jaesik Choi,
- Abstract要約: 統合勾配(IG)は、ベースラインと入力の間の積分経路がノイズ勾配のある領域を通過するとき、信頼できない説明が得られる。
本稿では,事前学習した変分オートエンコーダの潜在空間における帰属経路を構成するemphManifold-Aligned Guided Integrated Gradients (MA-GIG)を提案する。
- 参考スコア(独自算出の注目度): 26.87015322424142
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Feature attribution is central to diagnosing and trusting deep neural networks, and Integrated Gradients (IG) is widely used due to its axiomatic properties. However, IG can yield unreliable explanations when the integration path between a baseline and the input passes through regions with noisy gradients. While Guided Integrated Gradients reduces this sensitivity by adaptively updating low-gradient-magnitude features, input-space guidance still produces intermediate inputs that deviate from the data manifold. To address this limitation, we propose \emph{Manifold-Aligned Guided Integrated Gradients} (MA-GIG), which constructs attribution paths in the latent space of a pre-trained variational autoencoder. By decoding intermediate latent states, MA-GIG biases the path toward the learned generative manifold and reduces exposure to implausible input-space regions. Through qualitative and quantitative evaluations, we demonstrate that MA-GIG produces faithful explanations by aggregating gradients on path features proximal to the input. Consequently, our method reduces off-manifold noise and outperforms prior path-based attribution methods across multiple datasets and classifiers. Our code is available at https://github.com/leekwoon/ma-gig/.
- Abstract(参考訳): 特徴属性はディープニューラルネットワークの診断と信頼性の中心であり、統合勾配(IG)はその公理特性のために広く使用されている。
しかし、IGは、ベースラインと入力の間の積分パスがノイズ勾配のある領域を通過するとき、信頼できない説明を与えることができる。
Guided Integrated Gradientsは、低次磁気特性を適応的に更新することで、この感度を低下させるが、入力空間誘導は、データ多様体から逸脱する中間入力を生成する。
この制限に対処するため、事前学習された変分オートエンコーダの潜時空間における帰属経路を構成する「emph{Manifold-Aligned Guided Integrated Gradients}」(MA-GIG)を提案する。
中間潜伏状態の復号化により、MA-GIGは学習された生成多様体への経路を偏り、不可解な入力空間領域への露出を減らす。
質的,定量的な評価により,MA-GIGは入力に近似した経路特徴の勾配を集約することにより忠実な説明を生成することを示した。
そこで本手法は,複数のデータセットや分類器にまたがる先行経路に基づく帰属手法より,オフマニフォールドノイズを低減し,性能を向上する。
私たちのコードはhttps://github.com/leekwoon/ma-gig/で利用可能です。
関連論文リスト
- Grad-ELLM: Gradient-based Explanations for Decoder-only LLMs [52.15785423211181]
Grad-ELLMは、デコーダのみをベースとした大規模言語モデルのための勾配に基づく属性法である。
我々は、より公平な比較を提供する2つの忠実度指標$-Soft-NCと$-Soft-NSを導入する。
実験の結果,Grad-ELLMは他の属性法よりも優れた忠実性が得られることがわかった。
論文 参考訳(メタデータ) (2026-01-06T15:22:39Z) - Using the Path of Least Resistance to Explain Deep Networks [5.614094161229764]
Integrated Gradients (IG) は、広く使われている公理経路に基づく属性法である。
直進経路が原因で属性に欠陥があることが示されます。
代替として測地統合勾配(GIG)を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:29:24Z) - IG2: Integrated Gradient on Iterative Gradient Path for Feature Attribution [6.278326325782819]
反復勾配経路統合勾配(IG2)はディープニューラルネットワークの顕著な経路帰属法である。
IG2は逆ファクト勾配を反復的に積分経路に組み込み、新しい経路(GradPath)と新しいベースライン(GradCF)を生成する
XAIベンチマーク、ImageNet、MNIST、TRECの質問に対する回答、ウェハマップの失敗パターン、CelebAの顔属性の実験的結果は、IG2が優れた特徴属性を提供することを示す。
論文 参考訳(メタデータ) (2024-06-16T08:48:03Z) - GIFD: A Generative Gradient Inversion Method with Feature Domain
Optimization [52.55628139825667]
Federated Learning(FL)は、クライアントのプライバシを保護するための有望な分散機械学習フレームワークとして登場した。
近年の研究では、事前学習された生成逆ネットワーク(GAN)を事前知識として活用することにより、攻撃者が共有勾配を逆転し、FLシステムに対する機密データを回復できることが示されている。
textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD)を提案する。
論文 参考訳(メタデータ) (2023-08-09T04:34:21Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - The Manifold Hypothesis for Gradient-Based Explanations [55.01671263121624]
勾配に基づく説明アルゴリズムは知覚的に整合した説明を提供する。
特徴属性がデータの接する空間と一致しているほど、知覚的に一致している傾向にあることを示す。
説明アルゴリズムは、その説明をデータ多様体と整合させるよう積極的に努力すべきである。
論文 参考訳(メタデータ) (2022-06-15T08:49:24Z) - Geometrically Guided Integrated Gradients [0.3867363075280543]
我々は「幾何学的誘導積分勾配」と呼ばれる解釈可能性法を導入する。
提案手法は,入力の複数のスケールバージョンからモデルの動的挙動を探索し,各入力に対する最適な属性をキャプチャする。
また,従来のモデルランダム化試験を補完する「モデル摂動」正当性チェックを提案する。
論文 参考訳(メタデータ) (2022-06-13T05:05:43Z) - Guided Integrated Gradients: An Adaptive Path Method for Removing Noise [9.792727625917083]
統合グラディエンツ(IG)は、ディープニューラルネットワークのための一般的な特徴属性法である。
問題の原因の1つは、IG経路に沿ったノイズの蓄積である。
我々は、帰属経路自体に適応することを提案し、画像だけでなく、説明されるモデルにも経路を条件付けする。
論文 参考訳(メタデータ) (2021-06-17T20:00:55Z) - Understanding Integrated Gradients with SmoothTaylor for Deep Neural
Network Attribution [70.78655569298923]
ディープニューラルネットワークモデルの属性方法としての統合グラディエントは、シンプルな実装性を提供する。
理解しやすさに影響を及ぼす説明のうるささに悩まされる。
SmoothGrad法は,ノイズ問題を解消し,勾配に基づく帰属法の帰属写像を円滑化するために提案される。
論文 参考訳(メタデータ) (2020-04-22T10:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。