Fugu-MT 論文翻訳(概要): A General Taylor Framework for Unifying and Revisiting Attribution Methods

論文の概要: A General Taylor Framework for Unifying and Revisiting Attribution Methods

arxiv url: http://arxiv.org/abs/2105.13841v1
Date: Fri, 28 May 2021 13:57:16 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-31 13:54:59.301987
Title: A General Taylor Framework for Unifying and Revisiting Attribution Methods
Title（参考訳）: 属性の統一と再考のための一般Taylorフレームワーク
Authors: Huiqi Deng, Na Zou, Mengnan Du, Weifu Chen, Guocan Feng, Xia Hu
Abstract要約: 本稿では,その帰属問題を連立における個人報酬の決定方法としてモデル化したTaylor Attributionフレームワークを提案する。我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
参考スコア（独自算出の注目度）: 36.34893316038053
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Attribution methods provide an insight into the decision-making process of machine learning models, especially deep neural networks, by assigning contribution scores to each individual feature. However, the attribution problem has not been well-defined, which lacks a unified guideline to the contribution assignment process. Furthermore, existing attribution methods often built upon various empirical intuitions and heuristics. There still lacks a general theoretical framework that not only can offer a good description of the attribution problem, but also can be applied to unifying and revisiting existing attribution methods. To bridge the gap, in this paper, we propose a Taylor attribution framework, which models the attribution problem as how to decide individual payoffs in a coalition. Then, we reformulate fourteen mainstream attribution methods into the Taylor framework and analyze these attribution methods in terms of rationale, fidelity, and limitation in the framework. Moreover, we establish three principles for a good attribution in the Taylor attribution framework, i.e., low approximation error, correct Taylor contribution assignment, and unbiased baseline selection. Finally, we empirically validate the Taylor reformulations and reveal a positive correlation between the attribution performance and the number of principles followed by the attribution method via benchmarking on real-world datasets.
Abstract（参考訳）: アトリビューション手法は、個々の特徴に貢献スコアを割り当てることで、マシンラーニングモデル、特にディープニューラルネットワークの意思決定プロセスに関する洞察を提供する。しかし、帰属問題は明確に定義されておらず、貢献割当プロセスへの統一ガイドラインが欠落している。さらに、既存の帰属法はしばしば様々な経験的直観とヒューリスティックに基づいている。それでも、帰属問題の適切な説明を提供するだけでなく、既存の帰属法の統一や再検討にも適用できる一般的な理論的枠組みが欠如している。このギャップを埋めるために、本稿では、連立政権における個人報酬の決定方法として属性問題をモデル化したTaylor属性フレームワークを提案する。次に,14の主流帰属法をtaylorフレームワークに再構成し,それらの帰属法を合理性,忠実性,限界の観点から分析する。さらに,テイラー帰属フレームワークにおける良い帰属のための3つの原則,すなわち低近似誤差,正しいテイラー帰属割り当て,偏りのないベースライン選択を定式化する。最後に,taylor改革の有効性を実証的に検証し,実世界のデータセットのベンチマークによる帰属性能と原則数との正の相関を明らかにする。

関連論文リスト

TaylorPODA: A Taylor Expansion-Based Method to Improve Post-Hoc Attributions for Opaque Models [1.253514894229043]
既存のポストホックモデルに依存しない手法は、不透明なモデルに対する外部説明を生成する。本稿では,Taylor項固有の属性を管理するために,厳密な仮定,すなわち「精度」,「フィード」,「ゼロ差分性」を提案する。
論文参考訳（メタデータ） (2025-07-14T16:38:30Z)
Feature Attribution from First Principles [6.836945436656676]
あらゆる特徴帰属メソッドが満たすべき公理的フレームワークは、しばしば制限的すぎると我々は主張する。公理を課すのではなく、最も単純なモデルに対する属性を定義することから始める。深部ReLUネットワークの帰属を表すクローズドフォーム式を導出し,評価指標の最適化に向けて一歩踏み出した。
論文参考訳（メタデータ） (2025-05-30T15:53:11Z)
On the Evaluation Consistency of Attribution-based Explanations [42.1421504321572]
本稿では,画像領域における属性メソッドのベンチマークを行うオープンプラットフォームであるMeta-Rankを紹介する。 1) 異なる設定下での属性評価手法の評価は、異なる性能ランキングを得ることができ、2) 多数のケースで矛盾するが、同一のトレーニング軌道に沿った個別のチェックポイントにまたがる顕著な一貫性を示す。
論文参考訳（メタデータ） (2024-07-28T11:49:06Z)
Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。学習シナリオにおける同値性に基づく単一のフレームワークを提案する。我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文参考訳（メタデータ） (2024-05-09T12:52:22Z)
Backdoor-based Explainable AI Benchmark for High Fidelity Evaluation of Attribution Methods [49.62131719441252]
属性法は入力特徴の重要度を計算し、深層モデルの出力予測を説明する。本研究はまず,属性手法の信頼性ベンチマークが満たすであろう信頼度基準の集合を同定する。次に、望ましい忠実度基準に準拠したBackdoorベースのeXplainable AIベンチマーク(BackX)を紹介します。
論文参考訳（メタデータ） (2024-05-02T13:48:37Z)
Understanding and Unifying Fourteen Attribution Methods with Taylor Interactions [34.94946455284657]
各入力変数の属性/重要/貢献スコアを最終出力に推定することにより、ディープニューラルネットワーク(DNN)を説明する様々な属性法が開発されている。これらの方法がなぜ効果的か、どのように関連しているのかについて、統一的な理論的理解がまだ残っていない。 14種類の帰属法で推定される帰属スコアは2種類の効果の重み付け和として再構成可能であることを証明した。
論文参考訳（メタデータ） (2023-03-02T04:50:05Z)
Learning Against Distributional Uncertainty: On the Trade-off Between Robustness and Specificity [29.672383320615218]
本稿では,3つのアプローチを統一し,上記の課題に対処する新たな枠組みについて検討する。新しいモデルは、目に見えないデータとトレーニングデータへの特異性の間のトレードオフを明らかにする。実世界の様々なタスクの実験は、提案した学習フレームワークの優位性を検証する。
論文参考訳（メタデータ） (2023-01-31T11:33:18Z)
Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文参考訳（メタデータ） (2021-09-22T10:47:51Z)
A Unified Taylor Framework for Revisiting Attribution Methods [49.03783992773811]
我々はTaylor属性フレームワークを提案し、7つの主流属性メソッドをフレームワークに再構成する。我々はTaylor属性フレームワークにおいて、良い属性の3つの原則を確立する。
論文参考訳（メタデータ） (2020-08-21T22:07:06Z)
Beyond $\mathcal{H}$-Divergence: Domain Adaptation Theory With Jensen-Shannon Divergence [21.295136514836788]
広範に評価された経験的ドメイン逆行訓練と,$mathcalH$-divergenceに基づく理論上の相似性を明らかにする。我々は,Jensen-Shannon分散に基づく上層および下層ターゲットのリスク境界を直接証明することによって,新たな理論的枠組みを確立する。
論文参考訳（メタデータ） (2020-07-30T16:19:59Z)
GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文参考訳（メタデータ） (2020-02-21T00:27:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。