論文の概要: Explaining the data or explaining a model? Shapley values that uncover
non-linear dependencies
- arxiv url: http://arxiv.org/abs/2007.06011v4
- Date: Sat, 6 Mar 2021 05:46:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 05:20:23.490951
- Title: Explaining the data or explaining a model? Shapley values that uncover
non-linear dependencies
- Title(参考訳): データの説明やモデルの説明は?
非線型依存関係を明らかにする共有値
- Authors: Daniel Vidali Fryer, Inga Str\"umke, Hien Nguyen
- Abstract要約: 本稿では,エネルギー距離相関,アフィン不変距離相関,およびヒルベルト・シュミット独立基準をシェープリー値特性関数として導入し,その利用を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shapley values have become increasingly popular in the machine learning
literature thanks to their attractive axiomatisation, flexibility, and
uniqueness in satisfying certain notions of `fairness'. The flexibility arises
from the myriad potential forms of the Shapley value \textit{game formulation}.
Amongst the consequences of this flexibility is that there are now many types
of Shapley values being discussed, with such variety being a source of
potential misunderstanding. To the best of our knowledge, all existing game
formulations in the machine learning and statistics literature fall into a
category which we name the model-dependent category of game formulations. In
this work, we consider an alternative and novel formulation which leads to the
first instance of what we call model-independent Shapley values. These Shapley
values use a (non-parametric) measure of non-linear dependence as the
characteristic function. The strength of these Shapley values is in their
ability to uncover and attribute non-linear dependencies amongst features. We
introduce and demonstrate the use of the energy distance correlations,
affine-invariant distance correlation, and Hilbert-Shmidt independence
criterion as Shapley value characteristic functions. In particular, we
demonstrate their potential value for exploratory data analysis and model
diagnostics. We conclude with an interesting expository application to a
classical medical survey data set.
- Abstract(参考訳): 公平さ」という特定の概念を満たす上で、その魅力的な公理化、柔軟性、独特さのおかげで、共有価値は機械学習文学でますます人気を博している。
この柔軟性は、Shapley値 \textit{game formulation} の無数のポテンシャル形式から生じる。
この柔軟性の結果、多くの種類のシャプリー値が議論され、そのような多様性が潜在的な誤解の源となっている。
我々の知る限りでは、機械学習と統計学における既存のゲーム定式化はすべて、ゲーム定式化のモデル依存カテゴリと呼ばれるカテゴリに分類される。
本研究では,モデルに依存しないシェープ値(Shapley value)と呼ぶものの最初の例となる,代替的かつ新しい定式化について考察する。
これらのShapley値は特性関数として非線型依存の(非パラメトリック)測度を使用する。
これらのShapley値の強みは、機能間の非線形依存関係を発見して属性付ける能力にある。
我々は,エネルギー距離相関,アフィン不変距離相関,およびヒルベルト・シュミット独立基準をシェープリー値特性関数として導入し,実演する。
特に,探索的データ分析とモデル診断の潜在的な価値を示す。
最後に,古典的医学調査データセットに対する興味深い応用について述べる。
関連論文リスト
- Shape Arithmetic Expressions: Advancing Scientific Discovery Beyond Closed-Form Equations [56.78271181959529]
GAM(Generalized Additive Models)は、変数とターゲットの間の非線形関係をキャプチャできるが、複雑な特徴相互作用をキャプチャすることはできない。
本稿では,GAMのフレキシブルな形状関数と,数学的表現に見られる複雑な特徴相互作用を融合させる形状表現算術(SHARE)を提案する。
また、標準制約を超えた表現の透明性を保証するSHAREを構築するための一連のルールを設計する。
論文 参考訳(メタデータ) (2024-04-15T13:44:01Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - Learning from few examples with nonlinear feature maps [68.8204255655161]
我々はこの現象を探求し、AIモデルの特徴空間の次元性、データ分散の非退化、モデルの一般化能力の間の重要な関係を明らかにする。
本分析の主な推力は、元のデータを高次元および無限次元空間にマッピングする非線形特徴変換が結果のモデル一般化能力に与える影響である。
論文 参考訳(メタデータ) (2022-03-31T10:36:50Z) - Faith-Shap: The Faithful Shapley Interaction Index [43.968337274203414]
シャプリー値の重要な魅力は、それらが非常に自然な公理的性質の集合を一意に満足していることである。
そこで,本研究では,標準個々のシャプリー公理の相互作用拡張を満たすために忠実な相互作用指標を求めることにより,一意に忠実なシャプリー相互作用指数が得られることを示す。
論文 参考訳(メタデータ) (2022-03-02T04:44:52Z) - Exact Shapley Values for Local and Model-True Explanations of Decision
Tree Ensembles [0.0]
決定木アンサンブルの説明にShapley値を適用することを検討する。
本稿では,無作為林に適応し,決定木を増強できる,Shapley値に基づく特徴属性に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-12-16T20:16:02Z) - Explaining predictive models using Shapley values and non-parametric
vine copulas [2.6774008509840996]
特徴間の依存をモデル化するための2つの新しいアプローチを提案する。
提案手法の性能はシミュレーションされたデータセットと実データセットで評価される。
実験により、ブドウのコプラアプローチは、ライバルよりも真のシャプリー値により正確な近似を与えることが示された。
論文 参考訳(メタデータ) (2021-02-12T09:43:28Z) - Multicollinearity Correction and Combined Feature Effect in Shapley
Values [0.0]
共有値(Shapley value)は、特定の行に対する機能の重要性を表す。
我々は,Shapley値と相関した特徴量を計算する統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T12:28:42Z) - Causal Shapley Values: Exploiting Causal Knowledge to Explain Individual
Predictions of Complex Models [6.423239719448169]
シェープ値は、モデルの予測と平均ベースラインの差をモデルへの入力として使用する異なる特徴に関連付けるように設計されている。
これらの「因果」シャプリー値が、それらの望ましい性質を犠牲にすることなく、一般因果グラフに対してどのように導出できるかを示す。
論文 参考訳(メタデータ) (2020-11-03T11:11:36Z) - Predictive and Causal Implications of using Shapley Value for Model
Interpretation [6.744385328015561]
我々は、予測モデルと因果モデルの両方において重要な概念である、シェープ価値と条件独立の関係を確立した。
その結果,モデルから高いShapley値を持つ変数を排除しても必ずしも予測性能を損なうとは限らないことが示唆された。
さらに重要なことに、変数のShapley値は、関心の対象との因果関係を反映しない。
論文 参考訳(メタデータ) (2020-08-12T01:08:08Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。