論文の概要: On Model Extrapolation in Marginal Shapley Values
- arxiv url: http://arxiv.org/abs/2412.13158v1
- Date: Tue, 17 Dec 2024 18:33:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:01:36.410604
- Title: On Model Extrapolation in Marginal Shapley Values
- Title(参考訳): マルジナルシェープ値のモデル外挿について
- Authors: Ilya Rozenfeld,
- Abstract要約: モデル説明可能性の最も一般的な方法の1つは、Shapley値に基づいている。
シェープ値を計算するための限界的なアプローチは、うまく定義されていないかもしれないモデル外挿につながる。
本稿では,限界平均化を用いてモデル外挿を回避し,因果情報を付加することで因果シャプリー値を再現する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: As the use of complex machine learning models continues to grow, so does the need for reliable explainability methods. One of the most popular methods for model explainability is based on Shapley values. There are two most commonly used approaches to calculating Shapley values which produce different results when features are correlated, conditional and marginal. In our previous work, it was demonstrated that the conditional approach is fundamentally flawed due to implicit assumptions of causality. However, it is a well-known fact that marginal approach to calculating Shapley values leads to model extrapolation where it might not be well defined. In this paper we explore the impacts of model extrapolation on Shapley values in the case of a simple linear spline model. Furthermore, we propose an approach which while using marginal averaging avoids model extrapolation and with addition of causal information replicates causal Shapley values. Finally, we demonstrate our method on the real data example.
- Abstract(参考訳): 複雑な機械学習モデルの使用が増加し続けるにつれ、信頼性の高い説明可能性手法の必要性も高まっている。
モデル説明可能性の最も一般的な方法の1つは、Shapley値に基づいている。
シャプリー値を計算するために最もよく使われるアプローチは2つある。
前報では,因果関係の暗黙的な仮定により条件付きアプローチが根本的に欠陥があることが実証された。
しかし、Shapley値を計算するための限界的なアプローチが、うまく定義されていないかもしれないモデル外挿につながることはよく知られている事実である。
本稿では,モデル外挿が単純線形スプラインモデルの場合のシェープリー値に与える影響について検討する。
さらに,限界平均化を用いてモデル外挿を回避し,因果情報を付加することで因果シャプリー値を再現する手法を提案する。
最後に,本手法を実データ例で示す。
関連論文リスト
- Shapley Marginal Surplus for Strong Models [0.9831489366502301]
我々は、Shapley値がモデル予測の正確な説明であるが、機械学習モデル自体が真のデータ生成プロセス(DGP)の貧弱な説明であることを示している。
そこで,本研究では,特徴量から推定されるモデル空間を抽出する,新しい変数重要度アルゴリズム,Shapley Marginal Surplus for Strong Modelsを導入する。
論文 参考訳(メタデータ) (2024-08-16T17:06:07Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - Manifold Restricted Interventional Shapley Values [0.5156484100374059]
本稿では,モデル評価をデータ多様体に限定することにより,モデルの妥当性を尊重するemphManifoldShapを提案する。
理論的・実験的に、ManifoldShapはモデルの摂動のオフマニフォールドに対して堅牢であり、より正確で直感的な説明をもたらすことを示す。
論文 参考訳(メタデータ) (2023-01-10T15:47:49Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Explaining predictive models using Shapley values and non-parametric
vine copulas [2.6774008509840996]
特徴間の依存をモデル化するための2つの新しいアプローチを提案する。
提案手法の性能はシミュレーションされたデータセットと実データセットで評価される。
実験により、ブドウのコプラアプローチは、ライバルよりも真のシャプリー値により正確な近似を与えることが示された。
論文 参考訳(メタデータ) (2021-02-12T09:43:28Z) - Distilling Interpretable Models into Human-Readable Code [71.11328360614479]
人間可読性は機械学習モデル解釈可能性にとって重要で望ましい標準である。
従来の方法を用いて解釈可能なモデルを訓練し,それを簡潔で可読なコードに抽出する。
本稿では,幅広いユースケースで効率的に,確実に高品質な結果を生成する分別線形曲線フィッティングアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-01-21T01:46:36Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Predictive and Causal Implications of using Shapley Value for Model
Interpretation [6.744385328015561]
我々は、予測モデルと因果モデルの両方において重要な概念である、シェープ価値と条件独立の関係を確立した。
その結果,モデルから高いShapley値を持つ変数を排除しても必ずしも予測性能を損なうとは限らないことが示唆された。
さらに重要なことに、変数のShapley値は、関心の対象との因果関係を反映しない。
論文 参考訳(メタデータ) (2020-08-12T01:08:08Z) - Non-parametric Models for Non-negative Functions [48.7576911714538]
同じ良い線形モデルから非負関数に対する最初のモデルを提供する。
我々は、それが表現定理を認め、凸問題に対する効率的な二重定式化を提供することを証明した。
論文 参考訳(メタデータ) (2020-07-08T07:17:28Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。