論文の概要: Sampling Matters in Explanations: Towards Trustworthy Attribution Analysis Building Block in Visual Models through Maximizing Explanation Certainty
- arxiv url: http://arxiv.org/abs/2506.19442v1
- Date: Tue, 24 Jun 2025 09:15:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.566481
- Title: Sampling Matters in Explanations: Towards Trustworthy Attribution Analysis Building Block in Visual Models through Maximizing Explanation Certainty
- Title(参考訳): 説明事項のサンプリング:説明の最大化による視覚モデルにおけるブロック構築のための信頼できる帰属分析に向けて
- Authors: Róisín Luo, James McDermott, Colm O'Riordan,
- Abstract要約: 信頼に値する帰属分析を構築するには、サンプル分布の不一致問題を解決する必要がある。
本稿では,入力からの特徴を抑圧し,半最適サンプリング手法を提案する。
我々のアプローチは効果的であり、最先端のベースラインに対してより満足のいく説明を得ることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image attribution analysis seeks to highlight the feature representations learned by visual models such that the highlighted feature maps can reflect the pixel-wise importance of inputs. Gradient integration is a building block in the attribution analysis by integrating the gradients from multiple derived samples to highlight the semantic features relevant to inferences. Such a building block often combines with other information from visual models such as activation or attention maps to form ultimate explanations. Yet, our theoretical analysis demonstrates that the extent to the alignment of the sample distribution in gradient integration with respect to natural image distribution gives a lower bound of explanation certainty. Prior works add noise into images as samples and the noise distributions can lead to low explanation certainty. Counter-intuitively, our experiment shows that extra information can saturate neural networks. To this end, building trustworthy attribution analysis needs to settle the sample distribution misalignment problem. Instead of adding extra information into input images, we present a semi-optimal sampling approach by suppressing features from inputs. The sample distribution by suppressing features is approximately identical to the distribution of natural images. Our extensive quantitative evaluation on large scale dataset ImageNet affirms that our approach is effective and able to yield more satisfactory explanations against state-of-the-art baselines throughout all experimental models.
- Abstract(参考訳): 画像属性解析は、強調された特徴マップが入力の画素単位の重要性を反映するように、視覚モデルによって学習された特徴表現を強調しようとする。
グラディエント統合(Gradient Integration)は、複数の派生サンプルからの勾配を統合して、推論に関連する意味的特徴を強調することによって、属性分析におけるビルディングブロックである。
このようなビルディングブロックは、アクティベーションやアテンションマップなどの視覚モデルからの他の情報と組み合わせて、究極の説明を形成することが多い。
しかし, この理論解析により, 勾配積分における試料分布の自然な分布に対するアライメントの程度が, 説明の限界を低くすることを示した。
以前の研究はサンプルとして画像にノイズを加えており、ノイズ分布は説明の精度を低くする可能性がある。
我々の実験では、余分な情報がニューラルネットワークを飽和させることが示されています。
この目的のために、信頼に値する属性分析を構築するには、サンプル分布の不一致問題を解決する必要がある。
入力画像に余分な情報を加える代わりに、入力からの特徴を抑圧して半最適サンプリング手法を提案する。
特徴の抑制によるサンプル分布は,自然画像の分布とほぼ同一である。
大規模なデータセットに対する大規模な定量的評価 画像Netは、我々のアプローチが効果的であり、全ての実験モデルにおいて最先端のベースラインに対してより良好な説明を得ることができることを実証する。
関連論文リスト
- Elucidating the representation of images within an unconditional diffusion model denoiser [10.853652149844999]
生成拡散モデルは、ノイズ除去のためにトレーニングされたニューラルネットワークを用いてスコアを推定することにより、多様な画像データセット上の確率密度を学習する。
本稿では,その内部表現とスコアの計算をよりよく理解するために,ImageNetデータセットをデノナイズするために訓練されたUNetについて検討する。
UNetの中間ブロックは、個々の画像を活性チャネルのスパース部分集合に分解し、これらのチャネルの空間平均のベクトルは、基礎となるクリーン画像の非線形表現を提供することができることを示す。
論文 参考訳(メタデータ) (2025-06-02T17:33:34Z) - DiffusionPID: Interpreting Diffusion via Partial Information Decomposition [24.83767778658948]
入力テキストプロンプトを基本成分に分解するために,情報理論の原理を適用した。
個々のトークンとその相互作用が生成した画像をどのように形成するかを分析する。
PIDはテキスト・画像拡散モデルの評価と診断のための強力なツールであることを示す。
論文 参考訳(メタデータ) (2024-06-07T18:17:17Z) - Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Out of Sight, Out of Mind: A Source-View-Wise Feature Aggregation for
Multi-View Image-Based Rendering [26.866141260616793]
本稿では,ソースビューワイドな特徴集約手法を提案し,コンセンサスをロバストな方法で把握する。
提案手法を,合成画像や実画像を含む様々なベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2022-06-10T07:06:05Z) - Causal Transportability for Visual Recognition [70.13627281087325]
画像とラベルの関連性は、設定間では転送できないため、標準分類器がフェールすることを示す。
次に、すべての共起源を摂食する因果効果が、ドメイン間で不変であることを示す。
これにより、画像分類における因果効果を推定するアルゴリズムを開発する動機付けとなる。
論文 参考訳(メタデータ) (2022-04-26T15:02:11Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Understanding Integrated Gradients with SmoothTaylor for Deep Neural
Network Attribution [70.78655569298923]
ディープニューラルネットワークモデルの属性方法としての統合グラディエントは、シンプルな実装性を提供する。
理解しやすさに影響を及ぼす説明のうるささに悩まされる。
SmoothGrad法は,ノイズ問題を解消し,勾配に基づく帰属法の帰属写像を円滑化するために提案される。
論文 参考訳(メタデータ) (2020-04-22T10:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。