論文の概要: Topological Representations of Local Explanations
- arxiv url: http://arxiv.org/abs/2201.02155v1
- Date: Thu, 6 Jan 2022 17:46:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-07 15:15:11.180085
- Title: Topological Representations of Local Explanations
- Title(参考訳): 地域説明のトポロジカル表現
- Authors: Peter Xenopoulos, Gromit Chan, Harish Doraiswamy, Luis Gustavo Nonato,
Brian Barr, Claudio Silva
- Abstract要約: 局所的な説明の集合から単純化された表現を抽出するトポロジに基づくフレームワークを提案する。
我々のフレームワークは、説明可能性技術の違いを確実に識別できるだけでなく、安定した表現も提供できることを実証する。
- 参考スコア(独自算出の注目度): 8.559625821116454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Local explainability methods -- those which seek to generate an explanation
for each prediction -- are becoming increasingly prevalent due to the need for
practitioners to rationalize their model outputs. However, comparing local
explainability methods is difficult since they each generate outputs in various
scales and dimensions. Furthermore, due to the stochastic nature of some
explainability methods, it is possible for different runs of a method to
produce contradictory explanations for a given observation. In this paper, we
propose a topology-based framework to extract a simplified representation from
a set of local explanations. We do so by first modeling the relationship
between the explanation space and the model predictions as a scalar function.
Then, we compute the topological skeleton of this function. This topological
skeleton acts as a signature for such functions, which we use to compare
different explanation methods. We demonstrate that our framework can not only
reliably identify differences between explainability techniques but also
provides stable representations. Then, we show how our framework can be used to
identify appropriate parameters for local explainability methods. Our framework
is simple, does not require complex optimizations, and can be broadly applied
to most local explanation methods. We believe the practicality and versatility
of our approach will help promote topology-based approaches as a tool for
understanding and comparing explanation methods.
- Abstract(参考訳): モデルアウトプットの合理化の必要性から,ローカルな説明可能性メソッド -- 予測毎に説明を発生させようとする – がますます普及している。
しかし,様々なスケールや次元で出力を生成するため,局所的説明可能性法の比較は困難である。
さらに、いくつかの説明可能性手法の確率的性質から、ある観測値に対して矛盾する説明を生成する方法の異なる実行が可能である。
本稿では,局所的な説明の集合から簡易表現を抽出するトポロジに基づくフレームワークを提案する。
まず、説明空間とモデル予測の関係をスカラー関数としてモデル化する。
そして,この関数のトポロジカルスケルトンを計算する。
このトポロジカルスケルトンはそのような関数のシグネチャとして機能し、異なる説明法を比較するために使用される。
我々のフレームワークは、説明可能性技術の違いを確実に識別できるだけでなく、安定した表現も提供できることを実証する。
次に,本フレームワークを用いて局所的説明可能性手法の適切なパラメータを同定する方法を示す。
我々のフレームワークは単純であり、複雑な最適化を必要としないため、ほとんどの局所的な説明手法に広く適用することができる。
提案手法の実践性と汎用性は,説明手法の理解と比較のためのツールとしてトポロジに基づくアプローチを促進するのに役立つと考えている。
関連論文リスト
- Explainability for Large Language Models: A Survey [59.67574757137078]
大規模言語モデル(LLM)は、自然言語処理における印象的な能力を示している。
本稿では,トランスフォーマーに基づく言語モデルを記述する手法について,説明可能性の分類法を紹介した。
論文 参考訳(メタデータ) (2023-09-02T22:14:26Z) - Evaluating the Robustness of Interpretability Methods through
Explanation Invariance and Equivariance [72.50214227616728]
解釈可能性法は、それらの説明が説明されたモデルを忠実に記述した場合にのみ有用である。
特定の対称性群の下で予測が不変であるニューラルネットワークを考える。
論文 参考訳(メタデータ) (2023-04-13T17:59:03Z) - Understanding Post-hoc Explainers: The Case of Anchors [6.681943980068051]
本稿では,テキストの判断を説明するために,少数の単語群をハイライトする規則に基づく解釈可能性法の理論解析を行う。
アルゴリズムを定式化し有用な洞察を提供した後、数学的にアンカーが有意義な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-03-15T17:56:34Z) - The Shape of Explanations: A Topological Account of Rule-Based
Explanations in Machine Learning [0.0]
本稿では,ルールに基づく説明手法の枠組みを導入し,説明可能性の評価を行う。
好みのスキームは、ユーザがドメインについてどれだけ知っているかと、特徴空間上の確率測度に依存すると我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T02:58:00Z) - Object Representations as Fixed Points: Training Iterative Refinement
Algorithms with Implicit Differentiation [88.14365009076907]
反復的洗練は表現学習に有用なパラダイムである。
トレーニングの安定性とトラクタビリティを向上させる暗黙の差別化アプローチを開発する。
論文 参考訳(メタデータ) (2022-07-02T10:00:35Z) - Which Explanation Should I Choose? A Function Approximation Perspective
to Characterizing Post hoc Explanations [16.678003262147346]
一般的な説明手法は局所関数近似(LFA)フレームワークの例であることを示す。
本稿では,関数近似の観点に基づく指導原理を提案し,基礎となるモデルを復元した場合に有効となる方法を検討する。
実世界の様々なデータセット、モデルクラス、予測タスクを用いて理論的結果を実証的に検証する。
論文 参考訳(メタデータ) (2022-06-02T19:09:30Z) - Don't Explain Noise: Robust Counterfactuals for Randomized Ensembles [50.81061839052459]
我々は確率論的問題として、堅牢な対実的説明の生成を定式化する。
アンサンブルモデルのロバスト性とベース学習者のロバスト性との関係を示す。
本手法は, 反実的説明から初期観測までの距離をわずかに増加させるだけで, 高いロバスト性を実現する。
論文 参考訳(メタデータ) (2022-05-27T17:28:54Z) - Locally Invariant Explanations: Towards Stable and Unidirectional
Explanations through Local Invariant Learning [15.886405745163234]
不変リスク最小化原理に着想を得たモデル非依存的局所説明法を提案する。
我々のアルゴリズムは、訓練が簡単で効率的であり、サイド情報にアクセスすることなく、ブラックボックスの局所的な決定のための安定した入力機能を確認することができる。
論文 参考訳(メタデータ) (2022-01-28T14:29:25Z) - Explaining by Removing: A Unified Framework for Model Explanation [14.50261153230204]
削除に基づく説明は、各特徴の影響を定量化するための特徴除去をシミュレートする原則に基づいている。
1) メソッドが特徴を除去する方法,2) メソッドが説明するモデル動作,3) メソッドがそれぞれの特徴の影響を要約する方法,の3つの側面に沿って各メソッドを特徴付けるフレームワークを開発する。
新たに理解された説明手法のクラスは、説明可能性の文献にほとんど見落とされたツールを用いて、豊富なつながりを持つ。
論文 参考訳(メタデータ) (2020-11-21T00:47:48Z) - Towards Interpretable Natural Language Understanding with Explanations
as Latent Variables [146.83882632854485]
そこで本研究では,人間に注釈付き説明文の小さなセットだけを必要とする自然言語理解の枠組みを構築した。
我々のフレームワークは、ニューラルネットワークの基本的な推論過程をモデル化する潜在変数として、自然言語の説明を扱う。
論文 参考訳(メタデータ) (2020-10-24T02:05:56Z) - Learning explanations that are hard to vary [75.30552491694066]
例を越えた平均化は、異なる戦略を縫合する記憶とパッチワークのソリューションに有利であることを示す。
そこで我々は論理ANDに基づく単純な代替アルゴリズムを提案し,実験的に検証する。
論文 参考訳(メタデータ) (2020-09-01T10:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。