論文の概要: The Neglected Baseline in Model Interpretation
- arxiv url: http://arxiv.org/abs/2605.22417v2
- Date: Mon, 25 May 2026 13:56:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:37.958397
- Title: The Neglected Baseline in Model Interpretation
- Title(参考訳): モデル解釈における無視ベースライン
- Authors: Yongjin Cui, Xiaohui Fan,
- Abstract要約: 本稿では,モデル解釈の課題と解釈原理を整理し,ベースラインの重要性を実証する。
我々はさらに勾配に基づく手法、統合勾配法(IG)法、テイラー拡張を統一し、それらの関係を明らかにする。
そこで本研究では,モデル解釈手法の欠陥と誤りを解析する。
- 参考スコア(独自算出の注目度): 2.1760536522571807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We observe that existing model interpretation methods generally ignore the baseline, and such neglect often results in imprecise or even incorrect interpretation. In this paper, we reformulate the task of model interpretation and the interpretation principles for model interpretation results to demonstrate the importance of the baseline. We further unify gradient-based methods, Integrated Gradients (IG) methods, and Taylor expansion, clarifying the connections among them and explicitly identifying the baseline for each method. On this basis, we analyze the flaws and errors in related model interpretation methods (IG, LayerCAM, ODAM, Difference Map). We advocate evaluating the quality of model interpretation results precisely through the attribution error between the attribution result and the attribution target, rather than adopting flawed evaluation methods, such as those based on marginal-effect or the assumption of perfect model performance. We revise IG and develope a model interpretation method with a clear and reasonable baseline, achieving better results. Our method supports model interpretation based on features from any layer. Interpretation based on features from different layers are all reasonable, and the differences among these results reflect varying degrees of feature extraction at different feature extraction stages.
- Abstract(参考訳): 既存のモデル解釈法は一般にベースラインを無視するが、そのような無視は不正確あるいは誤った解釈をもたらすことが多い。
本稿では,モデル解釈の課題とモデル解釈結果の解釈原理を改訂し,ベースラインの重要性を実証する。
我々はさらに勾配に基づく手法、統合勾配法(IG)法、テイラー拡張を統一し、それらの関係を明確にし、各手法の基準線を明確に同定する。
そこで本研究では,モデル解釈手法(IG, LayerCAM, ODAM, difference Map)の欠陥と誤りを分析した。
本稿では, モデル解析結果の品質を, 帰属結果と帰属目標との帰属誤差によって正確に評価することを提唱する。
我々はIGを改訂し、明瞭で合理的なベースラインを持つモデル解釈法を開発し、より良い結果を得る。
提案手法は,任意の層の特徴に基づくモデル解釈をサポートする。
異なる層の特徴に基づく解釈は理にかなったものであり、これらの結果の違いは異なる特徴抽出段階における特徴抽出の程度を反映している。
関連論文リスト
- Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - Reference-Specific Unlearning Metrics Can Hide the Truth: A Reality Check [60.77691669644931]
本研究では,非学習モデルと参照モデル間の分布類似度を測定する新しい尺度であるFADE(Functional Alignment for Distributional Equivalence)を提案する。
FADEは出力分布全体の機能的アライメントをキャプチャし、真の未学習の原則的評価を提供する。
これらの知見は、現在の評価実践における根本的なギャップを明らかにし、FADEが真に効果的な未学習手法を開発し評価するための、より堅牢な基盤を提供することを示した。
論文 参考訳(メタデータ) (2025-10-14T20:50:30Z) - Towards a Unified Representation Evaluation Framework Beyond Downstream Tasks [9.390951257874187]
モデル表現における情報性、等分散、不変性、および要因の分散を定量化するための標準化されたプロトコルを導入する。
類似のダウンストリーム性能を持つモデルからの表現は、これらの属性に関して、かなり異なる振る舞いをすることができる。
論文 参考訳(メタデータ) (2025-05-09T17:58:52Z) - Towards credible visual model interpretation with path attribution [24.86176236641865]
path attributionフレームワークは、その公理的な性質から、ポストホックモデルの解釈ツールの中でも際立っている。
近年の進歩は、このフレームワークがいまだに反直感的な結果に悩まされていることを示している。
本研究では,視覚モデル解釈が経路属性の公理的特性を無効化できる状況を回避するためのスキームを考案する。
論文 参考訳(メタデータ) (2023-05-23T06:23:08Z) - Robust Semantic Interpretability: Revisiting Concept Activation Vectors [0.0]
画像分類のための解釈可能性手法は、モデルが系統的に偏りがあるか、あるいは人間と同じ手掛かりに従うかを明らかにすることを試みる。
提案するRobust Concept Activation Vectors (RCAV) は,個々のモデル予測やモデル全体の振る舞いに対する意味概念の影響を定量化する。
論文 参考訳(メタデータ) (2021-04-06T20:14:59Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - Learning Causal Semantic Representation for Out-of-Distribution
Prediction [125.38836464226092]
因果推論に基づく因果意味生成モデル(CSG)を提案し,その2つの要因を別々にモデル化する。
CSGはトレーニングデータに適合させることで意味的因子を識別できることを示し、この意味的識別はOOD一般化誤差の有界性を保証する。
論文 参考訳(メタデータ) (2020-11-03T13:16:05Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - General Pitfalls of Model-Agnostic Interpretation Methods for Machine
Learning Models [1.025459377812322]
我々は、間違った文脈で解釈技術を使用するなど、機械学習モデル解釈の多くの一般的な落とし穴を強調した。
平均モデル行動を記述するグローバルメソッドの落とし穴に注目するが、個々の予測を説明するローカルメソッドにも多くの落とし穴が適用される。
論文 参考訳(メタデータ) (2020-07-08T14:02:56Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。