論文の概要: A General Taylor Framework for Unifying and Revisiting Attribution
Methods
- arxiv url: http://arxiv.org/abs/2105.13841v1
- Date: Fri, 28 May 2021 13:57:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 13:54:59.301987
- Title: A General Taylor Framework for Unifying and Revisiting Attribution
Methods
- Title(参考訳): 属性の統一と再考のための一般Taylorフレームワーク
- Authors: Huiqi Deng, Na Zou, Mengnan Du, Weifu Chen, Guocan Feng, Xia Hu
- Abstract要約: 本稿では,その帰属問題を連立における個人報酬の決定方法としてモデル化したTaylor Attributionフレームワークを提案する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
- 参考スコア(独自算出の注目度): 36.34893316038053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attribution methods provide an insight into the decision-making process of
machine learning models, especially deep neural networks, by assigning
contribution scores to each individual feature. However, the attribution
problem has not been well-defined, which lacks a unified guideline to the
contribution assignment process. Furthermore, existing attribution methods
often built upon various empirical intuitions and heuristics. There still lacks
a general theoretical framework that not only can offer a good description of
the attribution problem, but also can be applied to unifying and revisiting
existing attribution methods. To bridge the gap, in this paper, we propose a
Taylor attribution framework, which models the attribution problem as how to
decide individual payoffs in a coalition. Then, we reformulate fourteen
mainstream attribution methods into the Taylor framework and analyze these
attribution methods in terms of rationale, fidelity, and limitation in the
framework. Moreover, we establish three principles for a good attribution in
the Taylor attribution framework, i.e., low approximation error, correct Taylor
contribution assignment, and unbiased baseline selection. Finally, we
empirically validate the Taylor reformulations and reveal a positive
correlation between the attribution performance and the number of principles
followed by the attribution method via benchmarking on real-world datasets.
- Abstract(参考訳): アトリビューション手法は、個々の特徴に貢献スコアを割り当てることで、マシンラーニングモデル、特にディープニューラルネットワークの意思決定プロセスに関する洞察を提供する。
しかし、帰属問題は明確に定義されておらず、貢献割当プロセスへの統一ガイドラインが欠落している。
さらに、既存の帰属法はしばしば様々な経験的直観とヒューリスティックに基づいている。
それでも、帰属問題の適切な説明を提供するだけでなく、既存の帰属法の統一や再検討にも適用できる一般的な理論的枠組みが欠如している。
このギャップを埋めるために、本稿では、連立政権における個人報酬の決定方法として属性問題をモデル化したTaylor属性フレームワークを提案する。
次に,14の主流帰属法をtaylorフレームワークに再構成し,それらの帰属法を合理性,忠実性,限界の観点から分析する。
さらに,テイラー帰属フレームワークにおける良い帰属のための3つの原則,すなわち低近似誤差,正しいテイラー帰属割り当て,偏りのないベースライン選択を定式化する。
最後に,taylor改革の有効性を実証的に検証し,実世界のデータセットのベンチマークによる帰属性能と原則数との正の相関を明らかにする。
関連論文リスト
- Understanding and Unifying Fourteen Attribution Methods with Taylor
Interactions [34.94946455284657]
各入力変数の属性/重要/貢献スコアを最終出力に推定することにより、ディープニューラルネットワーク(DNN)を説明する様々な属性法が開発されている。
これらの方法がなぜ効果的か、どのように関連しているのかについて、統一的な理論的理解がまだ残っていない。
14種類の帰属法で推定される帰属スコアは2種類の効果の重み付け和として再構成可能であることを証明した。
論文 参考訳(メタデータ) (2023-03-02T04:50:05Z) - Impossibility Theorems for Feature Attribution [21.88229793890961]
そこで本研究では,適度にリッチなモデルクラスでは,任意の特徴属性法がモデル振る舞いを推測するランダムな推測において,確実に改善できないことを示す。
本研究は, 局所モデル行動の特徴付け, 突発的特徴の同定, アルゴリズム的リコースなど, 一般的なエンドタスクに適用する。
論文 参考訳(メタデータ) (2022-12-22T17:03:57Z) - An Open-World Lottery Ticket for Out-of-Domain Intent Classification [51.50374666602328]
サブネットワークが提供するキャリブレーションされた信頼は、ドメイン内と外部の意図をよりよく区別することができる。
3つの実世界のデータセットの実験は、我々のアプローチが競合する一連のベースラインと比較して一貫した改善を確立することを実証している。
論文 参考訳(メタデータ) (2022-10-13T14:58:35Z) - Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。
対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。
比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文 参考訳(メタデータ) (2021-09-22T10:47:51Z) - Variational Disentanglement for Domain Generalization [68.85458536180437]
本稿では,変分拡散ネットワーク(VDN)という効果的なフレームワークを提供することにより,領域一般化の課題に取り組むことを提案する。
VDNは、ドメイン固有の機能とタスク固有の機能を切り離し、タスク固有のフィーチャは、見えないが関連するテストデータにより良い一般化が期待できる。
論文 参考訳(メタデータ) (2021-09-13T09:55:32Z) - Do Feature Attribution Methods Correctly Attribute Features? [5.58592454173439]
特徴帰属法は、解釈可能な機械学習で非常に人気がある。
属性」の定義に関する合意はありません。
塩分マップ,合理性,注意の3つの方法を評価した。
論文 参考訳(メタデータ) (2021-04-27T20:35:30Z) - A Unified Taylor Framework for Revisiting Attribution Methods [49.03783992773811]
我々はTaylor属性フレームワークを提案し、7つの主流属性メソッドをフレームワークに再構成する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文 参考訳(メタデータ) (2020-08-21T22:07:06Z) - Beyond $\mathcal{H}$-Divergence: Domain Adaptation Theory With
Jensen-Shannon Divergence [21.295136514836788]
広範に評価された経験的ドメイン逆行訓練と,$mathcalH$-divergenceに基づく理論上の相似性を明らかにする。
我々は,Jensen-Shannon分散に基づく上層および下層ターゲットのリスク境界を直接証明することによって,新たな理論的枠組みを確立する。
論文 参考訳(メタデータ) (2020-07-30T16:19:59Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。