論文の概要: A Comparative Study of Methods for Estimating Conditional Shapley Values
and When to Use Them
- arxiv url: http://arxiv.org/abs/2305.09536v1
- Date: Tue, 16 May 2023 15:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 14:19:23.941015
- Title: A Comparative Study of Methods for Estimating Conditional Shapley Values
and When to Use Them
- Title(参考訳): 条件付きシェープ値の推定方法と使用時期の比較検討
- Authors: Lars Henry Berge Olsen and Ingrid Kristine Glad and Martin Jullum and
Kjersti Aas
- Abstract要約: 我々は,新しい手法を開発し,提案手法を拡張し,新しい手法を異なるメソッドクラスに体系化し,比較と評価を行う。
本研究では,異なる手法のクラスが条件付き期待値を正確に見積もっているかを評価するため,広範囲なシミュレーション研究を行う。
また、実世界のデータ実験にもメソッドを適用し、異なるメソッドクラスやアプローチをいつ使うべきかを推奨する。
- 参考スコア(独自算出の注目度): 4.3012765978447565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shapley values originated in cooperative game theory but are extensively used
today as a model-agnostic explanation framework to explain predictions made by
complex machine learning models in the industry and academia. There are several
algorithmic approaches for computing different versions of Shapley value
explanations. Here, we focus on conditional Shapley values for predictive
models fitted to tabular data. Estimating precise conditional Shapley values is
difficult as they require the estimation of non-trivial conditional
expectations. In this article, we develop new methods, extend earlier proposed
approaches, and systematize the new refined and existing methods into different
method classes for comparison and evaluation. The method classes use either
Monte Carlo integration or regression to model the conditional expectations. We
conduct extensive simulation studies to evaluate how precisely the different
method classes estimate the conditional expectations, and thereby the
conditional Shapley values, for different setups. We also apply the methods to
several real-world data experiments and provide recommendations for when to use
the different method classes and approaches. Roughly speaking, we recommend
using parametric methods when we can specify the data distribution almost
correctly, as they generally produce the most accurate Shapley value
explanations. When the distribution is unknown, both generative methods and
regression models with a similar form as the underlying predictive model are
good and stable options. Regression-based methods are often slow to train but
produce the Shapley value explanations quickly once trained. The vice versa is
true for Monte Carlo-based methods, making the different methods appropriate in
different practical situations.
- Abstract(参考訳): shapleyの値は協調ゲーム理論に起源があるが、今日では業界や学界における複雑な機械学習モデルによる予測を説明するためのモデル非依存な説明フレームワークとして広く使われている。
Shapley値説明の異なるバージョンを計算するためのアルゴリズム的なアプローチはいくつかある。
本稿では,表データに適合する予測モデルの条件付きシェープ値に着目した。
非自明な条件予測を推定する必要があるため、正確な条件シェープ値の推定は困難である。
本稿では,新しい手法を開発し,先行提案手法を拡張し,改良および既存手法を異なるメソッドクラスに体系化し,比較・評価を行う。
メソッドクラスはモンテカルロ統合か回帰を使って条件付き期待値をモデル化する。
異なる手法クラスが条件付き期待値と条件付きシャプリー値をどのように正確に推定するかを評価するために,広範囲なシミュレーションを行った。
また,本手法をいくつかの実世界データ実験に適用し,異なるメソッドクラスやアプローチを使用する際の推奨を行う。
大まかに言えば、最も正確なShapley値説明を生成するため、データ分布をほぼ正確に指定できる場合、パラメトリック手法を使うことを推奨する。
分布が不明な場合、生成法と回帰モデルの両方が、基礎となる予測モデルと類似の形式を持つ。
回帰ベースの手法はトレーニングが遅くなることが多いが、一度訓練するとすぐにShapley値の説明が生成される。
モンテカルロをベースとした手法の逆は真であり、異なる方法が異なる状況で適している。
関連論文リスト
- Computing SHAP Efficiently Using Model Structure Information [3.6626323701161665]
本稿では, SHAP を時間的あるいはより高速に計算する手法を提案し, 付加性とダミーの仮定を満たす SHAP の定義を提案する。
最初のケースでは、加算特性と低次機能成分からSHAPを計算する方法を示す。
第2のケースでは、時間内にSHAPを計算できる式を導出します。
論文 参考訳(メタデータ) (2023-09-05T17:48:09Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Exact Shapley Values for Local and Model-True Explanations of Decision
Tree Ensembles [0.0]
決定木アンサンブルの説明にShapley値を適用することを検討する。
本稿では,無作為林に適応し,決定木を増強できる,Shapley値に基づく特徴属性に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-12-16T20:16:02Z) - Fast Hierarchical Games for Image Explanations [78.16853337149871]
本稿では,シェープリー係数の階層的拡張に基づく画像分類のモデル非依存な説明法を提案する。
他のShapleyベースの説明手法とは異なり、h-Shapはスケーラブルで近似を必要とせずに計算できる。
本手法は,合成データセット,医用画像シナリオ,一般コンピュータビジョン問題において,一般的なシャプリーベースおよび非サプリーベース手法と比較した。
論文 参考訳(メタデータ) (2021-04-13T13:11:02Z) - Explaining predictive models using Shapley values and non-parametric
vine copulas [2.6774008509840996]
特徴間の依存をモデル化するための2つの新しいアプローチを提案する。
提案手法の性能はシミュレーションされたデータセットと実データセットで評価される。
実験により、ブドウのコプラアプローチは、ライバルよりも真のシャプリー値により正確な近似を与えることが示された。
論文 参考訳(メタデータ) (2021-02-12T09:43:28Z) - Distilling Interpretable Models into Human-Readable Code [71.11328360614479]
人間可読性は機械学習モデル解釈可能性にとって重要で望ましい標準である。
従来の方法を用いて解釈可能なモデルを訓練し,それを簡潔で可読なコードに抽出する。
本稿では,幅広いユースケースで効率的に,確実に高品質な結果を生成する分別線形曲線フィッティングアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-01-21T01:46:36Z) - A Multilinear Sampling Algorithm to Estimate Shapley Values [4.771833920251869]
ゲーム理論に適用したマルチ線形拡張手法に基づく新しいサンプリング手法を提案する。
本手法は任意の機械学習モデル,特に多クラス分類や回帰問題に適用可能である。
論文 参考訳(メタデータ) (2020-10-22T21:47:16Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。