論文の概要: WeightedSHAP: analyzing and improving Shapley based feature attributions
- arxiv url: http://arxiv.org/abs/2209.13429v1
- Date: Tue, 27 Sep 2022 14:34:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:10:31.759998
- Title: WeightedSHAP: analyzing and improving Shapley based feature attributions
- Title(参考訳): weightedshap: shapleyベースの機能帰属の分析と改善
- Authors: Yongchan Kwon, James Zou
- Abstract要約: 共有価値(Shapley value)は、個々の特徴の影響を測定するための一般的なアプローチである。
WeightedSHAPを提案する。これはShapleyの価値を一般化し、データから直接フォーカスする限界貢献を学習する。
いくつかの実世界のデータセットにおいて、WeightedSHAPによって識別される影響のある特徴がモデルの予測を再カプセル化できることを示す。
- 参考スコア(独自算出の注目度): 17.340091573913316
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Shapley value is a popular approach for measuring the influence of individual
features. While Shapley feature attribution is built upon desiderata from game
theory, some of its constraints may be less natural in certain machine learning
settings, leading to unintuitive model interpretation. In particular, the
Shapley value uses the same weight for all marginal contributions -- i.e. it
gives the same importance when a large number of other features are given
versus when a small number of other features are given. This property can be
problematic if larger feature sets are more or less informative than smaller
feature sets. Our work performs a rigorous analysis of the potential
limitations of Shapley feature attribution. We identify simple settings where
the Shapley value is mathematically suboptimal by assigning larger attributions
for less influential features. Motivated by this observation, we propose
WeightedSHAP, which generalizes the Shapley value and learns which marginal
contributions to focus directly from data. On several real-world datasets, we
demonstrate that the influential features identified by WeightedSHAP are better
able to recapitulate the model's predictions compared to the features
identified by the Shapley value.
- Abstract(参考訳): shapley valueは、個々の特徴の影響を測定するための一般的なアプローチである。
shapley feature attributionはゲーム理論のdesiderataに基づいているが、いくつかの制約は特定の機械学習環境では自然ではない可能性があり、直観的なモデル解釈につながる。
特に、Shapleyの値はすべての限界貢献に同じ重みを使います。つまり、多数の他の特徴が与えられる場合と、少数の他の特徴が与えられる場合とでは、同じ重みを与えます。
この性質は、より大きな特徴集合がより小さい特徴集合よりも多かれ少なかれ情報的であれば問題となる。
我々の研究は、Shapley特徴属性の潜在的な制限について厳密な分析を行う。
より少ない特徴に対する大きな属性を割り当てることで,Shapley値が数学的に最適であるような単純な設定を同定する。
この観測から得られたWeightedSHAPは、Shapleyの値を一般化し、データから直接フォーカスする限界寄与を学習する。
いくつかの実世界のデータセットにおいて、WeightedSHAPによって識別される影響のある機能は、Shapley値によって識別される特徴と比較してモデルの予測を再カプセル化できることを示す。
関連論文リスト
- Improving the Sampling Strategy in KernelSHAP [0.8057006406834466]
KernelSHAPフレームワークは、重み付けされた条件付き期待値のサンプルサブセットを用いて、Shapley値の近似を可能にする。
本稿では,現在最先端戦略における重みの分散を低減するための安定化手法,サンプルサブセットに基づいてShapleyカーネル重みを補正する新しい重み付け方式,および重要なサブセットを包含して修正されたShapleyカーネル重みと統合する簡単な戦略を提案する。
論文 参考訳(メタデータ) (2024-10-07T10:02:31Z) - Scaling Laws for the Value of Individual Data Points in Machine Learning [55.596413470429475]
個々のデータポイントの値のスケーリング行動を調べることによって、新しい視点を導入する。
スケーリング法則を支持するための学習理論を提供し、それが様々なモデルクラスにまたがっていることを実証的に観察する。
私たちの研究は、個々のデータポイントの値のスケーリング特性を理解し、活用するための第一歩です。
論文 参考訳(メタデータ) (2024-05-30T20:10:24Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - On the Eigenvalues of Global Covariance Pooling for Fine-grained Visual
Recognition [65.67315418971688]
グローバル共分散プーリング(GCP)の小さな固有値をトラッピングすることで、よりスムーズな勾配が得られることを示す。
きめ細かいデータセットでは、小さな固有値の切り抜きは、モデルを収束させるのに失敗する。
この観測から着想を得て,小さな固有値の重要性を拡大するネットワーク分岐を提案する。
論文 参考訳(メタデータ) (2022-05-26T11:41:36Z) - Joint Shapley values: a measure of joint feature importance [6.169364905804678]
結合Shapley値を導入し、Shapley公理を直接拡張する。
ジョイントシェープの値は、モデルの予測に対する特徴の平均的な影響を測る。
ゲームの結果、ジョイントシェープの値は既存の相互作用指標とは異なる洞察を示します。
論文 参考訳(メタデータ) (2021-07-23T17:22:37Z) - groupShapley: Efficient prediction explanation with Shapley values for
feature groups [2.320417845168326]
シェープ価値は、機械学習モデルから予測を説明するための最も適切で理論的に健全なフレームワークの1つとして、自らを確立している。
Shapley値の主な欠点は、その計算複雑性が入力機能の数で指数関数的に増加することである。
本稿では、上記のボトルネックを扱うための概念的にシンプルなアプローチであるgroupShapleyを紹介する。
論文 参考訳(メタデータ) (2021-06-23T08:16:14Z) - Fast Hierarchical Games for Image Explanations [78.16853337149871]
本稿では,シェープリー係数の階層的拡張に基づく画像分類のモデル非依存な説明法を提案する。
他のShapleyベースの説明手法とは異なり、h-Shapはスケーラブルで近似を必要とせずに計算できる。
本手法は,合成データセット,医用画像シナリオ,一般コンピュータビジョン問題において,一般的なシャプリーベースおよび非サプリーベース手法と比較した。
論文 参考訳(メタデータ) (2021-04-13T13:11:02Z) - Multicollinearity Correction and Combined Feature Effect in Shapley
Values [0.0]
共有値(Shapley value)は、特定の行に対する機能の重要性を表す。
我々は,Shapley値と相関した特徴量を計算する統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T12:28:42Z) - Causal Shapley Values: Exploiting Causal Knowledge to Explain Individual
Predictions of Complex Models [6.423239719448169]
シェープ値は、モデルの予測と平均ベースラインの差をモデルへの入力として使用する異なる特徴に関連付けるように設計されている。
これらの「因果」シャプリー値が、それらの望ましい性質を犠牲にすることなく、一般因果グラフに対してどのように導出できるかを示す。
論文 参考訳(メタデータ) (2020-11-03T11:11:36Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。