論文の概要: A General Taylor Framework for Unifying and Revisiting Attribution
Methods
- arxiv url: http://arxiv.org/abs/2105.13841v1
- Date: Fri, 28 May 2021 13:57:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 13:54:59.301987
- Title: A General Taylor Framework for Unifying and Revisiting Attribution
Methods
- Title(参考訳): 属性の統一と再考のための一般Taylorフレームワーク
- Authors: Huiqi Deng, Na Zou, Mengnan Du, Weifu Chen, Guocan Feng, Xia Hu
- Abstract要約: 本稿では,その帰属問題を連立における個人報酬の決定方法としてモデル化したTaylor Attributionフレームワークを提案する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
- 参考スコア(独自算出の注目度): 36.34893316038053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attribution methods provide an insight into the decision-making process of
machine learning models, especially deep neural networks, by assigning
contribution scores to each individual feature. However, the attribution
problem has not been well-defined, which lacks a unified guideline to the
contribution assignment process. Furthermore, existing attribution methods
often built upon various empirical intuitions and heuristics. There still lacks
a general theoretical framework that not only can offer a good description of
the attribution problem, but also can be applied to unifying and revisiting
existing attribution methods. To bridge the gap, in this paper, we propose a
Taylor attribution framework, which models the attribution problem as how to
decide individual payoffs in a coalition. Then, we reformulate fourteen
mainstream attribution methods into the Taylor framework and analyze these
attribution methods in terms of rationale, fidelity, and limitation in the
framework. Moreover, we establish three principles for a good attribution in
the Taylor attribution framework, i.e., low approximation error, correct Taylor
contribution assignment, and unbiased baseline selection. Finally, we
empirically validate the Taylor reformulations and reveal a positive
correlation between the attribution performance and the number of principles
followed by the attribution method via benchmarking on real-world datasets.
- Abstract(参考訳): アトリビューション手法は、個々の特徴に貢献スコアを割り当てることで、マシンラーニングモデル、特にディープニューラルネットワークの意思決定プロセスに関する洞察を提供する。
しかし、帰属問題は明確に定義されておらず、貢献割当プロセスへの統一ガイドラインが欠落している。
さらに、既存の帰属法はしばしば様々な経験的直観とヒューリスティックに基づいている。
それでも、帰属問題の適切な説明を提供するだけでなく、既存の帰属法の統一や再検討にも適用できる一般的な理論的枠組みが欠如している。
このギャップを埋めるために、本稿では、連立政権における個人報酬の決定方法として属性問題をモデル化したTaylor属性フレームワークを提案する。
次に,14の主流帰属法をtaylorフレームワークに再構成し,それらの帰属法を合理性,忠実性,限界の観点から分析する。
さらに,テイラー帰属フレームワークにおける良い帰属のための3つの原則,すなわち低近似誤差,正しいテイラー帰属割り当て,偏りのないベースライン選択を定式化する。
最後に,taylor改革の有効性を実証的に検証し,実世界のデータセットのベンチマークによる帰属性能と原則数との正の相関を明らかにする。
関連論文リスト
- On the Evaluation Consistency of Attribution-based Explanations [42.1421504321572]
本稿では,画像領域における属性メソッドのベンチマークを行うオープンプラットフォームであるMeta-Rankを紹介する。
1) 異なる設定下での属性評価手法の評価は、異なる性能ランキングを得ることができ、2) 多数のケースで矛盾するが、同一のトレーニング軌道に沿った個別のチェックポイントにまたがる顕著な一貫性を示す。
論文 参考訳(メタデータ) (2024-07-28T11:49:06Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Backdoor-based Explainable AI Benchmark for High Fidelity Evaluation of Attribution Methods [49.62131719441252]
属性法は入力特徴の重要度を計算し、深層モデルの出力予測を説明する。
本研究はまず,属性手法の信頼性ベンチマークが満たすであろう信頼度基準の集合を同定する。
次に、望ましい忠実度基準に準拠したBackdoorベースのeXplainable AIベンチマーク(BackX)を紹介します。
論文 参考訳(メタデータ) (2024-05-02T13:48:37Z) - Understanding and Unifying Fourteen Attribution Methods with Taylor
Interactions [34.94946455284657]
各入力変数の属性/重要/貢献スコアを最終出力に推定することにより、ディープニューラルネットワーク(DNN)を説明する様々な属性法が開発されている。
これらの方法がなぜ効果的か、どのように関連しているのかについて、統一的な理論的理解がまだ残っていない。
14種類の帰属法で推定される帰属スコアは2種類の効果の重み付け和として再構成可能であることを証明した。
論文 参考訳(メタデータ) (2023-03-02T04:50:05Z) - Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。
対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。
比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文 参考訳(メタデータ) (2021-09-22T10:47:51Z) - A Unified Taylor Framework for Revisiting Attribution Methods [49.03783992773811]
我々はTaylor属性フレームワークを提案し、7つの主流属性メソッドをフレームワークに再構成する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文 参考訳(メタデータ) (2020-08-21T22:07:06Z) - Beyond $\mathcal{H}$-Divergence: Domain Adaptation Theory With
Jensen-Shannon Divergence [21.295136514836788]
広範に評価された経験的ドメイン逆行訓練と,$mathcalH$-divergenceに基づく理論上の相似性を明らかにする。
我々は,Jensen-Shannon分散に基づく上層および下層ターゲットのリスク境界を直接証明することによって,新たな理論的枠組みを確立する。
論文 参考訳(メタデータ) (2020-07-30T16:19:59Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。