論文の概要: A Unified Taylor Framework for Revisiting Attribution Methods
- arxiv url: http://arxiv.org/abs/2008.09695v3
- Date: Tue, 13 Apr 2021 09:00:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 20:44:55.965868
- Title: A Unified Taylor Framework for Revisiting Attribution Methods
- Title(参考訳): 帰属法を再検討するための統一taylorフレームワーク
- Authors: Huiqi Deng, Na Zou, Mengnan Du, Weifu Chen, Guocan Feng, and Xia Hu
- Abstract要約: 我々はTaylor属性フレームワークを提案し、7つの主流属性メソッドをフレームワークに再構成する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
- 参考スコア(独自算出の注目度): 49.03783992773811
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attribution methods have been developed to understand the decision-making
process of machine learning models, especially deep neural networks, by
assigning importance scores to individual features. Existing attribution
methods often built upon empirical intuitions and heuristics. There still lacks
a general and theoretical framework that not only can unify these attribution
methods, but also theoretically reveal their rationales, fidelity, and
limitations. To bridge the gap, in this paper, we propose a Taylor attribution
framework and reformulate seven mainstream attribution methods into the
framework. Based on reformulations, we analyze the attribution methods in terms
of rationale, fidelity, and limitation. Moreover, We establish three principles
for a good attribution in the Taylor attribution framework, i.e., low
approximation error, correct contribution assignment, and unbiased baseline
selection. Finally, we empirically validate the Taylor reformulations and
reveal a positive correlation between the attribution performance and the
number of principles followed by the attribution method via benchmarking on
real-world datasets.
- Abstract(参考訳): 個々の特徴に重要なスコアを割り当てることで、機械学習モデル、特にディープニューラルネットワークの決定過程を理解するために属性手法が開発された。
既存の帰属法はしばしば経験的直観とヒューリスティックに基づいている。
これらの帰属法を統一できるだけでなく、理論的にその合理性、忠実性、限界を明らかにするという一般的かつ理論的枠組みがまだ欠けている。
本稿では,このギャップを埋めるために,Taylor属性フレームワークを提案し,7つの主流属性メソッドをフレームワークに再構成する。
改定に基づき, 合理的, 忠実度, 限界度の観点から帰属法を解析する。
さらに,taylorアトリビューションフレームワークにおける優れた帰属のための3つの原則,すなわち低近似誤差,正しい貢献割り当て,偏りのないベースライン選択を定式化する。
最後に,taylor改革の有効性を実証的に検証し,実世界のデータセットのベンチマークによる帰属性能と原則数との正の相関を明らかにする。
関連論文リスト
- The Weighted M\"obius Score: A Unified Framework for Feature Attribution [17.358276581599643]
特徴属性は、各特徴が予測に与える影響を特定することによって、ブラックボックスモデルの予測の背後にある理由を説明することを目的としている。
統一されたフレームワークの欠如は、直接的に比較できないメソッドの急増につながった。
本稿では,パラメータ化属性フレームワークである重み付きM"obius Scoreを提案する。
論文 参考訳(メタデータ) (2023-05-16T06:27:27Z) - Impossibility Theorems for Feature Attribution [21.88229793890961]
そこで本研究では,適度にリッチなモデルクラスでは,任意の特徴属性法がモデル振る舞いを推測するランダムな推測において,確実に改善できないことを示す。
本研究は, 局所モデル行動の特徴付け, 突発的特徴の同定, アルゴリズム的リコースなど, 一般的なエンドタスクに適用する。
論文 参考訳(メタデータ) (2022-12-22T17:03:57Z) - An Open-World Lottery Ticket for Out-of-Domain Intent Classification [51.50374666602328]
サブネットワークが提供するキャリブレーションされた信頼は、ドメイン内と外部の意図をよりよく区別することができる。
3つの実世界のデータセットの実験は、我々のアプローチが競合する一連のベースラインと比較して一貫した改善を確立することを実証している。
論文 参考訳(メタデータ) (2022-10-13T14:58:35Z) - fairlib: A Unified Framework for Assessing and Improving Classification
Fairness [66.27822109651757]
Fairlibは、分類の公平さを評価し改善するためのオープンソースのフレームワークである。
我々は、前処理、訓練時間、後処理を含む14のデバイアス化手法を実装した。
組み込まれたメトリクスは、最も一般的に使用されるフェアネス基準をカバーし、フェアネス評価のためにさらに一般化およびカスタマイズすることができる。
論文 参考訳(メタデータ) (2022-05-04T03:50:23Z) - f-Domain-Adversarial Learning: Theory and Algorithms [82.97698406515667]
教師なしのドメイン適応は、トレーニング中、ターゲットドメイン内のラベルなしデータにアクセス可能な、多くの機械学習アプリケーションで使用されている。
領域適応のための新しい一般化法を導出し、f-発散体の変分的特徴に基づく分布間の相違性の新しい尺度を利用する。
論文 参考訳(メタデータ) (2021-06-21T18:21:09Z) - A General Taylor Framework for Unifying and Revisiting Attribution
Methods [36.34893316038053]
本稿では,その帰属問題を連立における個人報酬の決定方法としてモデル化したTaylor Attributionフレームワークを提案する。
我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文 参考訳(メタデータ) (2021-05-28T13:57:16Z) - Do Feature Attribution Methods Correctly Attribute Features? [5.58592454173439]
特徴帰属法は、解釈可能な機械学習で非常に人気がある。
属性」の定義に関する合意はありません。
塩分マップ,合理性,注意の3つの方法を評価した。
論文 参考訳(メタデータ) (2021-04-27T20:35:30Z) - Learning Causal Semantic Representation for Out-of-Distribution
Prediction [125.38836464226092]
因果推論に基づく因果意味生成モデル(CSG)を提案し,その2つの要因を別々にモデル化する。
CSGはトレーニングデータに適合させることで意味的因子を識別できることを示し、この意味的識別はOOD一般化誤差の有界性を保証する。
論文 参考訳(メタデータ) (2020-11-03T13:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。