論文の概要: Understanding and Unifying Fourteen Attribution Methods with Taylor
Interactions
- arxiv url: http://arxiv.org/abs/2303.01506v1
- Date: Thu, 2 Mar 2023 04:50:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 17:22:52.354420
- Title: Understanding and Unifying Fourteen Attribution Methods with Taylor
Interactions
- Title(参考訳): テイラー相互作用を用いた14の帰属方法の理解と統一
- Authors: Huiqi Deng, Na Zou, Mengnan Du, Weifu Chen, Guocan Feng, Ziwei Yang,
Zheyang Li, and Quanshi Zhang
- Abstract要約: 各入力変数の属性/重要/貢献スコアを最終出力に推定することにより、ディープニューラルネットワーク(DNN)を説明する様々な属性法が開発されている。
これらの方法がなぜ効果的か、どのように関連しているのかについて、統一的な理論的理解がまだ残っていない。
14種類の帰属法で推定される帰属スコアは2種類の効果の重み付け和として再構成可能であることを証明した。
- 参考スコア(独自算出の注目度): 34.94946455284657
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various attribution methods have been developed to explain deep neural
networks (DNNs) by inferring the attribution/importance/contribution score of
each input variable to the final output. However, existing attribution methods
are often built upon different heuristics. There remains a lack of a unified
theoretical understanding of why these methods are effective and how they are
related. To this end, for the first time, we formulate core mechanisms of
fourteen attribution methods, which were designed on different heuristics, into
the same mathematical system, i.e., the system of Taylor interactions.
Specifically, we prove that attribution scores estimated by fourteen
attribution methods can all be reformulated as the weighted sum of two types of
effects, i.e., independent effects of each individual input variable and
interaction effects between input variables. The essential difference among the
fourteen attribution methods mainly lies in the weights of allocating different
effects. Based on the above findings, we propose three principles for a fair
allocation of effects to evaluate the faithfulness of the fourteen attribution
methods.
- Abstract(参考訳): 各入力変数の属性/重要/貢献スコアを最終出力に推定することにより、ディープニューラルネットワーク(DNN)を説明する様々な属性法を開発した。
しかし、既存の帰属法はしばしば異なるヒューリスティックに基づいている。
これらの方法がなぜ効果的で、どのように関連しているかについての統一的な理論的理解がいまだに欠けている。
この目的のために、我々は初めて、異なるヒューリスティックに基づいて設計された14個の帰属法のコアメカニズムを、同じ数学的システム、すなわちテイラー相互作用の系に定式化した。
具体的には,14個の帰属法で推定される帰属スコアを,各入力変数の独立効果と入力変数間の相互作用効果という2種類の効果の重み付け和として再構成できることを実証する。
14の帰属法における本質的な違いは、主に異なる効果を割り当てる重みである。
本研究は,14の帰属方法の忠実度を評価するために,効果の公平な配分のための3つの原則を提案する。
関連論文リスト
- Unifying Causal Representation Learning with the Invariance Principle [21.375611599649716]
因果表現学習は、高次元観測から潜伏因果変数を復元することを目的としている。
我々の主な貢献は、既存の因果表現学習アプローチの多くが、その表現を既知のデータ対称性に方法論的に整合させることである。
論文 参考訳(メタデータ) (2024-09-04T14:51:36Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - The Weighted M\"obius Score: A Unified Framework for Feature Attribution [17.358276581599643]
特徴属性は、各特徴が予測に与える影響を特定することによって、ブラックボックスモデルの予測の背後にある理由を説明することを目的としている。
統一されたフレームワークの欠如は、直接的に比較できないメソッドの急増につながった。
本稿では,パラメータ化属性フレームワークである重み付きM"obius Scoreを提案する。
論文 参考訳(メタデータ) (2023-05-16T06:27:27Z) - Disentangled Representation for Causal Mediation Analysis [25.114619307838602]
因果媒介分析(英: Causal mediation analysis)は、直接的および間接的な効果を明らかにするためにしばしば用いられる方法である。
深層学習はメディエーション分析において有望であるが、現在の手法では、治療、メディエーター、結果に同時に影響を及ぼす潜在的共同創設者のみを前提としている。
そこで本研究では,助成金の表現を3つのタイプに分けて,自然的直接効果,自然間接効果,および全効果を正確に推定する,ディスタングル・メディエーション分析変分自動エンコーダ(DMAVAE)を提案する。
論文 参考訳(メタデータ) (2023-02-19T23:37:17Z) - Breaking Down Out-of-Distribution Detection: Many Methods Based on OOD
Training Data Estimate a Combination of the Same Core Quantities [104.02531442035483]
本研究の目的は,OOD検出手法の暗黙的なスコアリング機能を識別すると同時に,共通の目的を認識することである。
内分布と外分布の2値差はOOD検出問題のいくつかの異なる定式化と等価であることを示す。
また, 外乱露光で使用される信頼損失は, 理論上最適のスコアリング関数と非自明な方法で異なる暗黙的なスコアリング関数を持つことを示した。
論文 参考訳(メタデータ) (2022-06-20T16:32:49Z) - A General Taylor Framework for Unifying and Revisiting Attribution
Methods [36.34893316038053]
本稿では,その帰属問題を連立における個人報酬の決定方法としてモデル化したTaylor Attributionフレームワークを提案する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文 参考訳(メタデータ) (2021-05-28T13:57:16Z) - Learning Causal Semantic Representation for Out-of-Distribution
Prediction [125.38836464226092]
因果推論に基づく因果意味生成モデル(CSG)を提案し,その2つの要因を別々にモデル化する。
CSGはトレーニングデータに適合させることで意味的因子を識別できることを示し、この意味的識別はOOD一般化誤差の有界性を保証する。
論文 参考訳(メタデータ) (2020-11-03T13:16:05Z) - A Unified Taylor Framework for Revisiting Attribution Methods [49.03783992773811]
我々はTaylor属性フレームワークを提案し、7つの主流属性メソッドをフレームワークに再構成する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文 参考訳(メタデータ) (2020-08-21T22:07:06Z) - Self-Attention Attribution: Interpreting Information Interactions Inside
Transformer [89.21584915290319]
本稿では,トランスフォーマー内の情報相互作用を解釈する自己帰属属性法を提案する。
本研究は,BERT に対する非目標攻撃の実装において,その属性を敵対パターンとして用いることができることを示す。
論文 参考訳(メタデータ) (2020-04-23T14:58:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。